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La presente invention est relative a une nouvelle souche de corona- 
virus associe au syndrome respiratoire aigu severe (SRAS), issue d'un pr61evement 
repertorie sous le n° 031589 et prelev6 a Hanoi (Vietnam), a des molecules d'acide 
nucleique issues de son genome, aux proteines et peptides cod6s par lesdites 
5 molecules d'acide nucleique ainsi qu'a leurs applications, notamment en tant que reac- 
tifs de diagnostic et/ou comme vaccin. 

Le coronavirus est un virus k ARN monocatenaire, de polarite posi- 
tive, d'approximativement 30 kilobases qui se replique dans le cytoplasme des cellules 
hotes ; 1'extnSmite 5' du genome a une structure en coiffe et Textremite 3* comporte 
10 une queue polyA. Ce virus est enve!opp6 et comprend, a sa surface, -des structures 
p6plomeriques- denommees spicules. 

Le genome comprend les cadres ouverts de lecture ou ORF suivants, 
de son extremite 5' vers son extremity 3' : ORFla et ORFlb correspondant aux 
proteines du complexe de transcription-replication, et ORF-S, ORF-E, ORF-M et 
ORF-N correspondant aux proteines structurales S, E, M et N. II comprend egalement 
des ORFs correspondant a des proteines de fonction inconnue codees par : la region 
situee entre l'ORF-S et l'ORF-E et chevauchant cette derniere, la region situee entre 
V ORF-M et r ORF-N, et la region incluse dans 1 'ORF-N. 

La proteine S est une glycoprotein membranaire (200-220 kDa) qui 
se presente sous la forme de spicules ou "Spike" emergeant de la surface de 
Tenveloppe virale. Elle est responsable de l'attachement du virus aux recepteurs de la 
cellule h6te et de Tinduction de la fusion de Penveloppe virale avec la membrane 
cellulaire. 

La petite proteine d'enveloppe (E) egalement denommee sM (small 
membrane) qui est une proteine trans-membranaire non glycosylee d'environ 10 kDa, 
est la proteine pr6sente en plus faible quantite dans le virion. Elle joue un role moteur 
dans le processus de bourgeonnement des coronavirus qui se produit au niveau du 
compartiment intermediate dans le reticulum endoplasmique et Tappareil de Golgi 

La proteine M ou prot6ine de matrice (25-30 kDa) est une glyco- 
proteine membranaire plus abondante qui est integr6e dans la particule virale par une 
interaction M/E, tandis que 1'incorporation de S dans les particules est dirigee par une 
interaction S/M. Elle semble etre importante pour la maturation virale des coronavirus 



et pour la determination du site au niveau duquel les particules virales sont assem- 
blies. 

La proteine N ou proteine de nucleocapside (45-50 kDa) qui est la 
plus conservee parmi les proteines structurales des coronavirus, est necessaire pour 
5 encapsider I'ARN genomique puis pour diriger son incorporation dans le virion. Cette 
proteine est vraisemblablement egalement impliquee dans la replication de l'ARN. 

Lorsqu'une cellule h6te est infectee, le cadre de lecture (ORF) situe 
en 5' du genome viral est traduit en une polyproteine qui est clivee par les proteases 
virales et libere alors plusieurs proteines non-structural es telles que I'ARN- 
10 polymerase ARN dependante (Rep) et l'ATPase helicase (Hel). Ces deux proteines 
sont impliquees dans la replication du genome viral ainsi que dans la generation de 
transcrits qui sont utilises dans la synthese des proteines virales. Les mecanismes par 
lesquels ces ARNms sub-genomiques sont produits, ne sont pas complement 
compris ; cependant des faits recents tndiquent que les sequences de regulation de la 
15 transcription a l'extremite 5' de chaque gene repr6sentent des signaux qui regulent la 
transcription discontinue des ARNms sub-genomiques. 

Les proteines de la membrane virale (proteines S, E et M) sont inse- 
rees dans le compartiment intermediate, alors que l'ARN repliqu6 (brin +) s'assemble 
avec la proteine N (nucleocapside). Ce complexe proteine-ARN s'associe ensuite avec 
20 la prot6ine M incluse dans les membranes du reticulum endoplasmique et les 
particules virales se forment lorsque le complexe de la nucleocapside bourgeonne dans 
le reticulum endoplasmique. Le virus migre ensuite a travers le complexe du Golgi et 
eventuellement sort de la cellule, par exemple par exocytose. Le site de l'attacbement 
du virus a la cellule hote se trouve au niveau de la proteine S. 
25 Les coronavirus sont responsables de 15 a 30 % des rhumes chez 

l'Homme et d'infections respiratoires ou digestives chez les animaux, notamment le 
chat (FIPV : Feline infectious peritonitis virus), la volaille (IBV : Avian Infectious 
bronchitis virtis), la souris (MHV : Mouse Hepatitis virus), le pore (TGEV : 
Transmissible gastroenterititis virus, PEDV : Porcine Epidemic Diarrhea virus, 
30 PRCoV: Porcine Respiratory Coronavirus, HEV : Hemagglutinating encephalo- 
myelitis Virus) et les bovins (BcoV : Bovine coronavirus). 
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En general, chaque coronavirus n'affecte qu'une seule espece ; chez 
les individus immunocompetents, Pinfection induit des anticoxps eventuellement 
neutralisants et une immunite cellulaire, capables de detruire les cellules infectees. 

Une 6pidemie de pneumonie atypique, denommee syndrome respi- 
5 ratoire aigu severe (SARS ou Severe acute respiratory syndrome, SRAS en franQais) 
s'est propagee dans differents pays (Vietnam, Hong-Kong, Singapour, Thailande et 
Canada) au cours du premier trimestre 2003, a partir d'un foyer initial apparu en 
Chine dans le dernier trimestre de 2002. La severite de cette maladie est telle que son 
taux de mortality est d'environ 3 a 6 %. La determination de F agent causatif de cette 
1 0 maladie a et6 entreprise par de nombreux laboratoires, a travers le monde. 

En mars 2003, un nouveau coronavirus (SARS-CoV, SARS virus ou 
virus SRAS, en frangais) a ete isol6, en association avec des cas de syndrome respi- 
ratoire aigu severe (T.G.KSIAZEK et aL, The New England Journal of Medicine, 
2003, 348, 1319-1330 ; C. DROSTEN et aL, The New England Journal of Medicine, 
15 2003, 348, 1967-1976 ; Peiris et aL, Lancet, 2003, 361, 13 19-). 

Des sequences gSnomiques de ce nouveau coronavirus ont ainsi ete 
obtenues, notamment celles de Fisolat Urbani (Genbank n° d'acces AY2741 19.3 et A. 
MARRA et aL, Science, May 1, 2003, 300, 1399-1404) et de Fisolat de Toronto 
(Tor2, Genbank n° d'acces AY 278741 et A. ROTA et aL, Science, 2003, 300, 1394- 
20 1399). 

L'organisation du genome est comparable a celle des autres corona- 
virus connus permettant ainsi de confirmer Fappartenance du SARS-CoV a la famille 
des Coronaviridae ; les cadres ouverts de lecture ORFla et lb et les cadres ouverts de 
lecture correspondant aux prot&nes S, E, M, et N, ainsi qu'a des proteines codees par : 

25 la region situee entre TORF-S et I'ORF-E (ORF3), la region situee entre 1'ORF-S et 
rORF-E et chevauchant TORF-E (ORF4), la region situ6e entre TORF-M et TORF-N 
(ORF7 a ORF11) et la region correspondant a l'ORF-N (ORF13 et ORF14), ont 
notamment 6t6 identifiees. 

Sept differences ont ete mises en evidence entre les sequences des 

30 isolats Tor2 et Urbani ; 3 correspondent a des mutations silencieuses (c/t en position 
16622 et a/g en position 19064 de FORFlb, t/c en position 24872 de TORF-S) et 4 
modifient la sequence en acides amines de respectivement : les prot&nes codees par 



l'ORFla (c/t en position 7919 correspondant a la mutation A/V), la proteine S (g/t en 
position 23220 correspondant a la mutation A/S), la proteine codee par l'ORF3 (a/g en 
position 25298 correspondant a la mutation R/G) et de la prot6ine M (t/c en position 
26857 correspondant a la mutation S/P). 

En outre, 1' analyse phylogenetique montre que le SARS-CoV est 
eloigne des autres coronavirus et qu'il est apparu, ni par mutation de coronavirus 
respiratoires humains, ni par recombinaison entre des coronavirus connus (pour une 
revue, voir Holmes, J.C.L, 2003, 111, 1605-1609). 

La mise en evidence et la prise en compte de nouveaux variants sont 
importantes pour la mise au point de reactifs de detection et de diagnostic du SRAS 
suffisamment sensibles et specifiques ainsi qu'a des compositions immunogenes aptes 
a proteger des populations contre des epidemies de SRAS. 

Les Inventeurs ont maintenant mis en evidence une autre souche de 
coronavirus associe au SRAS, qui se distingue des isolats Tor2 et Urbani. 

La presente invention a done pour objet, une souche isolee ou puri- 
fiee de coronavirus humain associe au syndrome respiratoke aigu severe, caracterisee 
en ce que son genome presente sous la forme d'ADN complementaire un codon serine 
en position 23220-23222 du gene de la proteine S ou un codon glycine en position 
25298-25300 du gene de l'ORF3, et un codon alanine en position 7918-7920 de 
l'ORFla ou un codon serine en position 26857-26859 du gene de la proteine M, 
lesdites positions etant indiquees en r6ference a la sequence Genbank AY274119.3. 

Selon un mode de realisation avantageux de ladite souche, 
l'equivalent ADN de son genome presente une sequence correspondant a la sequence 
SEQ ID NO : 1 ; cette souche de coronavirus est issue du prelevement de lavage 
bronchoalveolaire d'un patient atteint de SRAS, repertori6 sous le n° 031589 et 
e£fectu6 a Thdpital francais de Hanoi (Vietnam). 

Conformement a l'invention, ladite sequence SEQ ID NO :1 est 
celle de l'acide desoxyribonucleique correspondant a la molecule d'acide 
ribonucleique du genome de la souche isolee de coronavirus telle que definie ci- 
dessus. 

La sequence SEQ ID NO : 1 se distingue de la s6quence Genbank 
AY2741 19 3 (isolat Tor2) en ce qu'elle possede les mutations suivantes : 
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- g/t en position 23220 ; le codon alanine (get) en position 577 de la 
sequence en acides amines de la proteine S de Tor2 est remplace par un codon serine 
(tct), 

- a/g en position 25298 ; le codon arginine (aga) en position 11 de la 
5 sequence en acide amines de la proteine codee par PORF3 de Tor 2 est remplace par 

un codon glycine (gga). 

En outre, la sequence SEQ ID NO : 1 se distingue de la sequence 
Genbank AY278741 (isolat Urbani) en ce qu'elle possede les mutations suivantes : 

- t/c en position 7919 ; le codon valine (gtt) en position 2552 de la 
10 sequence en acides amines de la proteine codee par l'ORFla est remplace par un 

codon alanine (get), 

- t/c en position 16622 : cette mutation ne modifie pas la sequence 
en acides amines des prolines codees par l'ORFlb (mutation silencieuse), 

- g/a en position 19064 : cette mutation ne modifie pas la sequence 
15 en acides amines des proteines codees par TORFlb (mutation silencieuse), 

- c/t en position 24872 : cette mutation ne modifie pas la sequence 
en acides amines de la proteine S, et 

- c/t en position 26857 : le codon proline (ccc) en position 154 de la 
sequence en acides amines de la proteine M est remplace par un codon serine (tec). 

20 En Pabsence de mention particuliere, les positions des sequences 

nucleotidiques et peptidiques sont indiqu6es en reference a la sequence Genbank 
AY274119.3. 

La presente invention a egalement pour objet un polynucleotide isole 
ou purifie, caracterise en ce que sa sequence est celle du g6nome de la souche isolee 
25 de coronavirus telle que definie ci-dessus. 

Selon un mode de realisation avantageux dudit polynucleotide il 
presente la sequence SEQ ID NO : 1. 

La presente invention a egalement pour objet un polynucleotide isole 
ou purifie, caracteris<§ en ce que sa sequence hybride dans des conditions de forte 
30 stringence avec la sequence du polynucleotide tel que defini ci-dessus. 

Les termes « isole ou purifie » signifient modifie « par la main de 
1'homme » a partir de Petat naturel ; autrement dit si un objet existe dans la nature, il 



est dit isole on purifie s'il a ete modifie ou extrait de son environnement naturel ou les 
deux. Par exemple, un polynucleotide ou une proteine/un peptide naturellement 
present dans un organisme vivant n'est ni iso!6, ni purifie ; en revanche le meme poly- 
nucleotide ou proteine /peptide separe des molecules coexistantes dans son environ- 
5 nement naturel, obtenu par clonage, amplification et/ou synthese chimique est isole au 
sens de la presente invention. De plus, un polynucleotide ou une prot6ine/peptide qui 
est introduit dans un organisme par transformation, manipulation genetique ou par 
toute autre methode, est « isole » meme s'il est pr6sent dans ledit organisme. Le terme 
purifie tel qu'utilis6 dans la presente invention, signifie que les proteines /peptides 
1 0 selon l'invention sont essentiellement libres d'association avec les autres proteines ou 
polypeptides, comme l'est par exemple le produit purifie de la culture de cellules 
notes recombinantes ou le produit purifie a partir d'une source non-recombinante. 

Au sens de la presente invention, on entend par conditions d*hybri- 
dation de forte stringency des conditions de temperature et de force ionique choisies 
15 de telle maniere qu'elles permettent le maintien de ttiybridation specifique et selective 

entre polynucleotides complementaires. v 

A titre d'illustration, des conditions de forte stringence aux fins de iV (- 
definir les polynucleotides ci-dessus, sont avantageusement les suivantes : lliybrida- ,| 
tion ADN-ADN ou ADN-ARN est realisee en deux etapes : (1) prehybridation a 42°C 
20 pendant 3 heures en tampon phosphate (20 mM pH 7,5) contenant 5 x SSC (1 x SSC 
correspond a une solution 0,15 M NaCl + 0, 015 M citrate de sodium), 50 % de 
formamide, 7 % de sodium dodecyl sulfate (SDS), 10 x Denhardt's, 5 % de dextran 
sulfate et 1 % dADN de sperme de saumon ; (2) hybridation pendant 20 heures a 
42°C suivie de 2 lavages de 20 minutes a 20°C en 2 x SSC + 2 % SDS, 1 lavage de 20 
25 minutes a 20°C en 0,1 x SSC + 0,1 % SDS. Le dernier lavage est pratique en 0,1 x 
SSC + 0,1 % SDS pendant 30 minutes a 60°C. 

La pr6sente invention a egalement pour objet un fragment represen- 
tatif du polynucleotide tel que defini ci-dessus, caracterise en ce qu'il est susceptible 
d'etre obtenu, soit par l'utilisation d'enzymes de restriction dont les sites de 
30 reconnaissance et de coupure sont presents dans ledit polynucleotide tel que defini ci- 
dessus, soit par amplification a l'aide d'amorces oligonucleotidiques specifiques dudit 
polynucleotide tel que defini ci-dessus, soit par transcription in vitro, soit par synthese 
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chimique. 

Selon un mode de realisation avantageux dudit fragment, il est selec- 
tionne dans le groupe constitu£ par : PADNc correspondant a au moins un cadre 
ouvert de lecture (ORF) choisi parmi : ORFla, ORFlb, ORF-S, ORF-E, ORF-M, 
5 ORF-N, ORF3, ORF4, ORF7 a ORF11, ORF13 et ORF14, et PADNc correspondant 
aux extremites 5' ou 3' non-codantes dudit polynucleotide, 

Selon une disposition avantageuse de ce mode de realisation, ledit 
fragment presente une sequence selectionnee dans le groupe constitue par : 

- les sequences SEQ ID NO : 2 et 4 repr£sentant PADNc corres- 
1 0 pondant a PORF-S qui code pour la proteine S, 

- les sequences SEQ ID NO : 13 et 15 representant PADNc corres- 
pondant & PORF-E qui code pour la proteine E, 

- les sequences sequence SEQ ID NO : 1 6 et 1 8 representant 
PADNc correspondant a PORF-M qui code pour la proteine M, 

15 - les sequences SEQ ID NO : 36 et 38 representant PADNc corres- 

pondant a P ORF-N qui code pour la prot6ine N, 

- les sequences representant les ADNc correspondant respective- 
ment : aux ORFla et ORFlb (ORFlab, SEQ ID NO : 31), aux ORF3 et ORF4 (SEQ 
ID NO : 7, 8), aux ORF 7 a 1 1 (SEQ ID NO : 1 9, 20), a PORF13 (SEQ ID NO : 32) et 

20 a PORF14 (SEQ ID NO : 34), et 

- les sequences representant les ADNc correspondant respectivement 
aux extremity 5'(SEQ ID NO : 39 et 72) et 3' non-codantes (SEQ ID NO : 40, 73) 
dudit polynucleotide. 

La presente invention a egalement pour objet un fragment de 
25 PADNc codant pour la proteine S, tel que defini ci-dessus, caracterise en ce qu'il 
presente une sequence selectionnee dans le groupe constitue par les sequences SEQ ID 
NO : 5 et 6 (fragments Sa et Sb). 

La presente invention a egalement pour objet un fragment de 
PADNc correspondant aux ORFla et ORFlb tel que d&fini ci-dessus, caracteris£ en ce 
30 qu'il presente une sequence selectionnee dans le groupe constitue par les sequences 
SEQ ID NO : 41 a 54 (fragments L0 a L12). 
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La presente invention a egalement pour objet un fragment du poly- 
nucleotide tel que defini ci dessus, caracterise en ce qu'il presente au moins 15 bases 
ou paires de bases consecutives de la s6quence du genome de ladite souche incluant au 
moins une de celles situees en position 7979, 16622, 19064, 23220, 24872, 25298 et 
26857. De preference, il s'agit d'un fragment de 20 a 2500 bases ou paires de bases, 
de maniere preferee de 20 a 400. 

Selon un mode de realisation avantageux dudit fragment, il inclut au 
moins un couple de bases ou de paires de bases correspondant aux positions 
suivantes : 7919 et 23220, 7919 et 25298, 16622 et 23220, 19064 et 23220, 16622 et 
25298, 19064 et 25298, 23220 et 24872, 23220 et 26857, 24872 et 25298, 25298 et 
26857. 

La presente invention a 6galement pour objet des amorces d'au 
moins 1 8 bases aptes a amplifier un fragment du genome d'un coronavirus associe au 
SRAS ou de T equivalent ADN de celui-ci. 

Selon un mode de realisation desdites amorces, elles sont selection- 

nees dans le groupe constitue par : 

- la paire d' amorces n° 1 correspondant respectivement aux positions 
28507 a 28522 (amorce sens, SEQ ID NO : 60) et 28774 a 28759 (amorce anti-sens, 
SEQ ID NO : 61) de la sequence du polynucleotide tel que defini ci-dessus, et 

- la paire d' amorces n° 2 correspondant respectivement aux positions 
28375 a 28390 (amorce sens, SEQ ID NO : 62) et 28702 a 28687 (amorce anti-sens, 
SEQ ID NO : 63) de la sequence du polynucleotide tel que defini ci-dessus. 

La presente invention a egalement pour objet une sonde apte a 
detecter la presence du genome d'un coronavirus associe au SRAS ou d'un fragment 
de celui-ci, caracterisee en ce qu'elle est selectionnee dans le groupe constitue par : les 
fragments tels que d6finis ci-dessus et les fragments correspondant aux positions 
suivantes de la sequence du polynucleotide tel que defini ci-dessus : 28561 a 28586, 
28588 a 28608, 28541 a 28563 et 28565 a 28589 (SEQ ID NO : 64 a 67). 

Les sondes et amorces selon l'lnvention peuvent etre marquees 
directement ou indirectement par un compose radioactif ou non radioactif par des 
methodes bien connues de 1'Homme du Metier, afin d'obtenir un signal detectable 
et/ou quantifiable. Parmi les isotopes radioactifs utilises, on peut citer le 32 P, le 33 P, le 
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35 S, le 3 H ou 1 ,I25 L Les entites non radioactives sont selectionnees parmi les ligands 
tels que la biotine, 1'avidine, la streptavidine, la digoxygenine, les haptenes, les colo- 
rants, les agents luminescents tels que les agents radioluminescents, ch&nolumines- 
cents, bioluminescents, fluores cents, phosphorescents. 
5 L'invention englobe les sondes et les amorces marquees derivees des 

sequences precedentes. 

De telles sondes et amorces sont utiles pour le diagnostic de 
F infection par un corona virus associe au SRAS. 

La pr<§sente invention a egalement pour objet une methode de detec- 
10 tion d'un coronavirus associe au SRAS, a partir d'un Schantillon biologique, laquelle 
methode est caracterisee en ce qu'elle comprend au moins : 

(a) Fextraction d'acides nucleiques presents dans ledit echantillon 

biologique, 

(b) ramplification d'un fragment de l'ORF-N par RT-PCR a l'aide 
1 5 d'une paire d'amorces telle que defmie ci-dessus, et 

(c) la detection par tout moyen approprie des produits 
d'amplifications obtenus en (b), 

Les produits d'amplifications (amplicons) en (b) sont de 268 pb pour 
la paire d'amorces n° 1 et de 328 pb pour la paire d'amorces n°2. 

20 Selon un mode de mise en ceuvre avantageux dudit procede, I'etape 

(b) de detection est realisee a l'aide d'au moins une sonde correspondant aux positions 
28561 a 28586, 28588 a 28608, 28541 a 28563 et 28565 a 28589 de la sequence du 
polynucleotide tel que defini ci-dessus. 

De preference, le genome du coronavirus associe au SRAS est 

25 detects et Sventuellement quantifie par PCR en temps r6el, a l'aide de la paire 
d'amorces n°2 et des sondes correspondant aux positions 28541 a 28563 et 28565 a 
28589 marquees avec des composes differents, notamment des agents fluorescents 
differents. 

La RT-PCR en temps reel qui met en oeuvre cette paire d'amorces et 
30 cette sonde est tres sensible puisqu ! elle permet de d6tecter 10 2 copies d'ARN et jusqu'a 
10 copies d'ARN, elle est en outre fiable et reproductible. 
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L'invention englobe les polydesoxyribonucleotides et les polyribo- 
nucleotides simple-brin, double-brin et tripe-brin correspondant a la sequence du 
genome de la souche isolee de coronavirus et de ses fragments tels que definis ci- 
dessus, ainsi qu'a leurs s6quences complementaires, sens ou anti-sens, notamment les 
5 ARN et les ADNc correspondant a la sequence du genome et de ses fragments tels que 
definis ci-dessus. 

La presente invention englobe egalement les fragments 
d'amplification obtenus a Faide d'amorces sp6cifiques du genome de la souche puri- 
fiee ou isolee tel que defini ci-dessus, notamment a l'aide d'amorces et de paires 

10 d'amorces telles que definies ci-dessus, les fragments de restriction constitues par ou 
comprenant la sequence des fragments tels que definis ci-dessus, les fragments obte- 
nus par transcription in vitro a partir d'un vecteur contenant la sequence SEQ ID NO : 
1 ou un fragment tel que defini ci-dessus, ainsi que des fragments obtenus par 
synthese chimique. Des exemples de fragments de restriction sont deduits de la carte 

15 de restriction de la sequence SEQ ID NO : 1 illustree par la figure 13. Conformement 
a l'invention lesdits fragments sont, soit sous forme de fragments isoles, soit sous 
forme de melanges de fragments. L'invention englobe egalement les fragments modi- f 

fies, par rapport aux precedents, par enlevement, ou addition de nucleotides dans une ./ 

X 

proportion d' environ 15 %, par rapport a la longueur des fragments ci-dessus et/ou 
20 modifies au niveau de la nature des nucleotides, des lors que les fragments nucleo- 

tidiques modifies conservent une capacite d'hybridation avec les sequences d'ARN 

g&iomiques ou antigenomiques de Tisolat tel que defini ci-dessus. 

Les molecules d'acide nucleique selon l'invention sont obtenues par 

les methodes classiques, connues en elles-memes, en suivant les protocoles standards 
25 tels que ceux decrits dans Current Protocols in Molecular Biology (Frederick M. 

AUSUBEL,2000 t Wiley and son Inc t Library of Congress, USA). Par exemple, elles 

peuvent etre obtenues par amplification d f une sequence nucleique par PCR ou RT- 

PCR ou bien par synthese chimique totale ou partielle. 

La pr£sente invention a Egalement pour objet une puce ou filtre a 
30 ADN ou a ARN, caracterise en ce qu'il comprend au moins un polynucleotide ou l'un 

de ses fragments tels que d6finis ci-dessus. 

Les puces ou filtres a ADN ou a ARN selon Finvention sont 
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prepares par les methodes classiques, connues en elles-memes, comme par exemple 
greffage chimique ou 61ectrochimique d'oligonucleotides sur support de verre ou de 
nylon. * 

La pr£sente invention a 6galement pour objet un vecteur de clonage 
5 et/ou d 'expression recombinant, notamment un plasmide ou un phage comprenant un 
fragment d'acide nucleique tel que defini ci-dessus. De preference, ledit vecteur 
recombinant est un vecteur depression dans lequel ledit fragment d r acide nucl&que 
est place sous le controle d'elements regulateurs de la transcription et de la traduction 
appropries. En outre, ledit vecteur peut comprendre des sequences (etiquettes ou tag) 
10 fusionnees en phase avec Textremite 5 1 et/ou 3' dudit insert, utiles pour rimmobilisa- 
tion, et/ou la d6tection et/ou la purification de la proteine exprimee a partir dudit 
vecteur. 

Ces vecteurs sont construits et introduits dans des cellules hotes par 
les methodes classiques d'ADN recombinant et de genie genetique, qui sont connues 
15 en elles-memes. De nombreux vecteurs dans lesquels on peut inserer une molecule 
d'acide nucleique d'interet afin de Pintroduire et de la maintenir dans une cellule hote, 
, sont connus en eux-memes ; le choix d'un vecteur approprie depend de Tutilisation 
envisag6e pour ce vecteur (par exemple replication de la sequence d'interet, expres- 
sion de cette sequence, maintien de la sequence sous forme extrachromosomique ou 
20 bien integration dans le materiel chromosomique de Thote), ainsi que de la nature de la 
cellule h6te. 

Conformement a Pinvention, ledit plasmide est notamment selec- 
tionne parmi les plasmides suivants : 

- le plasmide, denomme SARS-S, compris dans la souche bacte- 
25 rienne d^posee sous le n° 1-3059, le 20 juin 2003, aupres de la Collection Nationale de 
Cultures de Microorganismes, 25 rue du Docteur Roux, 75724 Paris Cedex 15 ; il 
contient la sequence d'ADNc codant pour la prot6ine S de la souche de SARS-CoV 
issue du prelevement repertorie sous le n° 031589, laquelle sequence correspondant 
aux nucleotides des positions 21406 a 25348 (SEQ ID NO : 4), en reference a la 
30 sequence Genbank AY2741 19.3, 

- le plasmide, denomm6 SARS-S1, compris dans la souche bacte- 
rienne d^posee sous le n° 1-3020, le 12 mai 2003, aupres de la Collection Nationale de 
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Cultures de Microorganismes, 25 rue du Docteur Roux, 75724 Paris Cedex 1 5 ; il 
contient un fragment 5' de la sequence d'ADNc codant pour la proteine S de la souche 
de SARS-CoV issue du pretevement repertorie sous le n° 031589, telle que definie ci- 
dessus, lequel fragment correspondant aux nucleotides des positions 21406 a 23454 

5 (SEQ ID NO :5), en r6f&rence a la s6quence Genbank AY274 119.3 Tor2, 

- le plasmide, denomme SARS-S2, compris dans la souche bacte- 
rienne deposee sous le n° 1-3019, le 12 mai 2003, aupres de la Collection Nationale de 
Cultures de Microorganismes, 25 rue du Docteur Roux, 75724 Paris Cedex 15 ; il 
contient un fragment 3'de la sequence d'ADNc codant pour la proteine S de la souche 

1 0 de SARS-CoV issue du prelevement repertorie sous le n° 03 1 589, telle que d6finie ci- 
dessus, lequel fragment correspondant aux nucleotides des positions 23322 a 25348 
(SEQ ID NO :6), en reference a la sequence Genbank n° d'acces AY2741 1 9.3, 

- le plasmide, d&iomme SARS-SE, compris dans la souche bacte- 
rienne deposee sous le n° 1-3126, le, 13 novembre 2003, aupres de la Collection 

15 Nationale de Cultures de Microorganismes, 25 rue du Docteur Roux, 75724 Paris 
Cedex 15; il contient l'ADNc correspondant a la region situ6e entre l'ORF-S et 
l'ORF-E et chevauchant l'ORF-E de la souche de SARS-CoV issue du prelevement 
repertorie sous le n° 031589, telle que definie ci-dessus, laquelle region correspondant 
aux nucleotides des positions 25110 a 26244 (SEQ ID NO :8), en r6ference a la 

20 sequence Genbank n° d'acc&s AY2741 19.3, 

- le plasmide, d6nomm6 SARS-E, compris dans la souche bacte- 
rienne d6posee sous le n° 1-3046, le 28 mai 2003, aupres de la Collection Nationale de 
Cultures de Microorganismes, 25 rue du Docteur Roux, 75724 Paris Cedex 15 ; il 
contient la sequence d'ADNc codant pour la proline E de la souche de SARS-CoV 

25 issue du pr61evement repertorie sous le n° 03 1 589, telle que definie ci-dessus, laquelle 
sequence correspondant aux nucleotides des positions 26082 a 26413 (SEQ ID 
NO :15), en reference a la sequence Genbank n° d'acces AY2741 19.3, 

, - le plasmide, denomme SARS-M ; compris dans la souche bact6- 

rienne deposee sous le n° 1-3047, le 28 mai 2003, aupres de la Collection Nationale de 

30 Cultures de Microorganismes, 25 rue du Docteur Roux, 75724 Paris Cedex 15 ; il 
contient la sequence d'ADNc codant pour la prot&ne M de la souche de SARS-CoV 
issue du prelevement repertorie sous le n° 031589, telle que definie ci-dessus; 
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laquelle sequence correspondant aux nucleotides des positions 26330 a 27098 (SEQ 
ID NO :18), en reference a la sequence Genbank n° d'acces AY2741 193, 

- le plasmide denomme SARS-MN, compris dans la souche bacte- 
rienne deposee sous le n° 1-3125, le 13 novembre 2003, aupres de la Collection 

5 Nationale de Cultures de Microorganismes, 25 rue du Docteur Roux, 75724 Paris 
Cedex 15 ; il contient la sequence d'ADNc correspondant a la region situee entre 
TORF-M et FORF-N de la souche de SARS-CoV issue du prelevement repertorie 
sous le n° 031589 et prelevee a Hanoi, telle que definie ci-dessus, laquelle sequence 
correspondant aux nucleotides des positions 26977 a 2821 8 (SEQ ID NO :20), en refe- 
1 0 rence a la sequence Genbank n° d'acces AY2741 1 9.3, 

- le plasmide d6nomme SARS-N, compris dans la souche bacte- 
rienne deposee sous le n° 1-3048, le 5 juin 2003, aupres de la Collection Nationale de 
Cultures de Microorganismes, 25 rue du Docteur Roux, 75724 Paris Cedex 15 ; il 
contient FADNc codant pour la proteine N de la souche de SARS-CoV issue du 

15 prelevement repertorie sous le n° 031589, telle que d6finie ci-dessus, laquelle 
sequence correspondant aux nucleotides des positions 28054 a 29430 (SEQ ID 
NO :38), en reference a la sequence Genbank n° d'acces AY2741 1 9.3, 

- le plasmide denomme SARS-5'NC, compris dans la souche bact6- 
rienne deposee sous le n° I- 3124, le 7 novembre 2003, aupres de la Collection 

20 Nationale de Cultures de Microorganismes, 25 rue du Docteur Roux, 75724 Paris 
Cedex 15 ; il contient l'ADNc correspondant a Pextremite 5'non codante du genome 
de la souche de SARS-CoV issue du prelevement r6pertorie sous le n° 031589, telle 
que definie ci-dessus, laquelle sequence correspondant aux nucleotides des positions 1 
a 204 (SEQ ID NO :39), en reference a la sequence Genbank n° d'acces AY2741 19.3, 

25 - le plasmide d6nomme SARS-3'NC, compris dans la souche bacte- 

rienne deposee sous le n° 1-3123 le 7 novembre 2003, aupres de la Collection 
Nationale de Cultures de Microorganismes, 25 rue du Docteur Roux, 75724 Paris 
Cedex 15. ; il contient la sequence d'ADNc correspondant a I'extr6mit6 3'non codante 
du genome de la souche de SARS-CoV issue du prelevement repertorie sous le n° 

30 031589, telle que definie ci-dessus, laquelle sequence correspondant a celle situee 
entre le nucleotide en position 28933 a 29727 (SEQ ID NO :40), en reference a la 
s6quence Genbank n° d'acces AY2741 19.3, se termine par une s6rie de nucleotides a., 
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- le plasmide d'expression denomm6 pIV2.3N, contenant un 
fragment d'ADNc codant pour une fusion C-terminale de la proteine N (SEQ ID NO : 
37) avec une 6tiquette polyhistidine, 

- le plasmide depression d6nomme pIV2.3S c , contenant un 
5 fragment d'ADNc codant pour une fusion C-terminale du fragment corresponds aux 

positions 475 a 1 193 de la sequence en acides amines de la proteine S (SEQ ID NO : 
3) avec une etiquette polyhistidine, 

- le plasmide d'expression P IV2.3Sl, contenant un fragment 
d'ADNc codant pour une fusion C-terminale du fragment correspondant aux positions 

10 14 a 1 193 de la sequence en acides amines de la proteine S (SEQ ID NO : 3) avec une 

etiquette polyhistidine, 

- le plasmide d'expression denomme pIV2.4N, contenant un 
fragment d'ADNc codant pour une fusion N-terminale de la proteine N (SEQ ID NO : 
3) avec une etiquette polyhistidine, 

15 _ le plasmide d'expression denomme pIV2.4S c ou pIV2.4Si, 

contenant un insert codant pour une fusion N-terminale du fragment correspondant 
aux positions 475 a 1 193 de la s6quence en acides amines de la proteine S (SEQ ID 
NO : 3) avec une etiquette polyhistidine, et 

- le plasmide d'expression denomme p IV2.4Sl contenant un 
20 fragment d'ADNc codant pour une fusion N-terminale du fragment correspondant aux 

positions 14 a 1 193 de la sequence en acides amines de la proteine S (SEQ ID NO : 3) 
avec une etiquette polyhistidine. 

Selon une disposition avantageuse du plasmide d'expression tel que 
defmi ci-dessus, il est compris dans une souche bacterienne qui a ete deposee sous le 
25 n° I- 3117, le 23 octobre 2003, aupres de la Collection Nationale de Cultures de 
Microorganismes, 25 rue du Docteur Roux, 75724 Paris Cedex 15. 

Selon une autre disposition avantageuse du plasmide d'expression 
tel que defmi ci-dessus, il est compris dans une souche bacterienne qui a ete deposee 
sous le n° I- 3118, le 23 octobre 2003, aupres de la Collection Nationale de Cultures 
30 de Microorganismes, 25 rue du Docteur Roux, 75724 Paris Cedex 1 5. 

La presente invention a egalement pour objet une banque d'ADNc 
caracterisee en ce qu'elle comprend des fragments tels que dermis ci-dessus, en parti- 



1er depot 



15 

culier des fragments d'amplification ou des fragments de restriction, clones dans un 
vecteur recombinant, notamment un vecteur d' expression (banque d' expression). 

La pr6sente invention a egalement pour objet des cellules, notam- 
ment des cellules procaryotes, modifiees par un vecteur recombinant tel que defini ci- 
5 dessus. 

Les vecteurs recombinants tels que definis ci-dessus et les cellules 
transformtes par lesdits vecteurs d' expression sont avantageusement utilises pour la 
production des proteines et des peptides correspondants. Les banques depression 
derivees desdits vecteurs, ainsi que les cellules transformees par lesdites banques 

10 d'expression sont avantageusement utilisees pour identifier les epitopes immunogenes 
(epitopes B et T) des proteines du coronavirus associe au SRAS. 

La presente invention a egalement pour objet les proteines et les 
peptides purifiees ou isol6es, caracterisSs en ce qu'ils sont codes par le polynucleotide 
ou Tun de ses fragments tels que definis ci-dessus. 

15 Selon un mode de r6alisation avantageux de Finvention, ladite 

proteine est selectionnee dans le groupe constitue par : 

- la proline S de sequence SEQ ID NO :3 

- la prot6ine E de sequence SEQ ID NO :14 

- la proteine M de sequence SEQ ID NO :17 
20 - la proline N de sequence SEQ ID NO : 37 

- les prot&nes codees par les ORFs : ORFla, ORFlb, ORF3, ORF4 
et ORF7 a ORF11, ORF13 et ORF14 de sequence respectivement, SEQ ID NO :74, 
75, 10, 12, 22, 24, 26, 28, 30, 33 et 35. 

Selon un mode de realisation avantageux de Finvention, ledit 
25 peptide est s61ectionne dans le groupe constitue par : 

a) les peptides correspondant aux positions 14 a 1193 et 475 a 1 193 
de la sequence en acides amines de la prot6ine S, 

b) les peptides correspondant aux positions 2 a 14 (SEQ ID NO : 69) 
et 100 a 221 de la s6quence en acides amines de la proteine M ; ces peptides corres- 

30 pondent respectivement a l'ectodomaine et a Fendodomaine de la proteine M, et 

c) les peptides correspondant aux positions 1 a 12 (SEQ ID NO : 70) 
et 53 a 76 (SEQ ID NO : 71) de la sequence en acides amines de la proteine E ; ces 
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peptides correspondent respectivement a 1'ectodomaine et a l'extremite C-terminale de 
la proteine E, et 

d) les peptides de 5 a 50 acides amines consecutifs, de preference de 
10 a 30 acides amines, inclus ou chevauchant partiellement ou totalement la sequence 

5 des peptides tels que dermis en a), b) ou c). 

La presente invention a egalement pour objet un peptide caracterise 
en ce qu'il presente une sequence de 7 a 50 acides amines incluant un residu d'acide 
amine selection^ dans le groupe constitu6 par : 

- l'alanine situee en position 2552 de la s6quence en acides amines 

10 de la proteine codee par l'ORFla. 

- la serine situee en position 577 de la sequence en acides amines de 
la prot6ine S de la souche de SARS-CoV telle que definie ci-dessus, 

- la glycine en position 11 de la sequence en acides amines de la 
proteine codee par l'ORFS de la souche de SARS-CoV telle que definie ci-dessus, 

15 .la S 6rine en position 154 de la sequence en acides amines de la 

proteine M de la souche de SARS-CoV telle que definie ci-dessus. 

La presente invention a egalement pour objet un anticorps ou un 
fragment d'anticorps polyclonal ou monoclonal, susceptible d'etre obtenu par 
immunisation d'un animal avec un vecteur recombinant tel que defini ci-dessus, une 

20 banque d'ADNc telle que definie ci-dessus ou bien une proteine ou un peptide tels que 
definis ci-dessus, caract6rise en ce qu'il se lie avec l'une au moins des proteines 
codees par le SARS-CoV telles que definies ci-dessus. 

L'invention englobe les anticorps polyclonaux, les anticorps mono- 
clonaux, les anticorps chimeriques tels que les anticorps humanises, ainsi que leurs 

25 fragments (Fab, Fv, scFv). 

Au sens de la presente invention, on entend par anticorps 

chimerique, relativement a un anticorps d'une espece animale particuliere ou d'une 

classe particuliere d'anticorps, un anticorps comprenant tout ou partie d'une chaine 

lourde et/ou d'une chaine legere d'un anticorps d'une autre espece animale ou d'une 

30 autre classe d'anticorps. 

Au sens de la presente invention, on entend par anticorps humanise 
une immmunoglobuline humaine dans laquelle les residus des CDRs 
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(Complementary-Determining Regions) qui forment le site de liaison a l'antigene sont 
remplaces par ceux d'un anticorps monoclonal non-humain possedant la specificite, 
Taffinit6 ou l'activite recherchees. Par comparaison avec les anticorps non-humains, 
les anticorps humanises sont moins immunogenes et possedent une demi-vie prolon- 
5 g6e chez l'Homme car ils ne possddent qu'une faible proportion de sequences non- 
humaines etant donne que la quasi-totalite des residus des regions FR (Framework) et 
de la region constante (Fc) de ces anticorps sont ceux d'une sequence consensus 
d'irnmunoglobulines humaines. 

La presente invention a egalement pour objet une puce a proteine, 
10 caracterisee en ce qu'elle comprend une proteine, un peptide ou bien un anticorps tels 
que definis ci-dessus. 

Les puces a proteine selon Tinvention sont pr^parees par les 
methodes classiques, connues en elles-memes. Parmi les supports appropries sur 
lesquels peuvent etre immobilises des proteines, on peut citer ceux en matiere 
1 5 plastique ou en verre, notamment sous la forme de microplaques. 

La pr6sente invention a egalement pour objet des reactifs derives de 
la souche isolee de coronavirus associe au SRAS, issue du prelevement repertorie sous 
le n° 031589, utiles pour l'etude et le diagnostic de Tinfection provoquee par un 
coronavirus assocte au SRAS, lesquels reactifs sont selectionnes dans le groupe cons- 
20 tituepar : 

(a) une paire d'amorces, une sonde ou une puce a ADN telles que 
definies ci-dessus, 

(b) un vecteur recombinant ou une cellule modifiee tels que definis 

ci-dessus, 

25 (c) une souche isolee de coronavirus ou un polynucleotide tels que 

d&finis ci-dessus, 

(d) une proteine ou un peptide tel que defini ci-dessus, 

(e) un anticorps ou fragment d'anticorps tels que definis ci-dessus, et 

(f) une puce a prot&ne telle que definie ci-dessus. 

30 Ce s differents reactifs sont prepares et utilises selon les techniques 

classiques de biologie moleculaire et d'immunologie, en suivant les protocoles 
standards tels que ceux decrits dans Current Protocols in Molecular Biology 
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(Frederick M. AUSUBEL, 2000, Wiley and Son Inc., Library of Congress, USA), 
dans Current Protocols in Immunology (John E. Cologan, 2000, Wiley and Son Inc. 
Library of Congress, USA) et dans Antibodies : A Laboratory Manual (E. Howell and 
D Lane, Cold Spring Harbor Laboratory, 1988). 

5 Les fragments d'acide nucleique selon l'invention sont prepares et 

utilises selon les techniques classiques telles que definies ci-dessus. Les peptides et les 
proteines selon l'invention sont prepares par les techniques d'ADN recombinant, 
connues de l'Homme du metier, notamment a l'aide des vecteurs recombinants tels 
que definis ci-dessus. Alternativement, les peptides selon 1'invention peuvent €tre 

1 0 prepares par les techniques classiques de synthese en phase solide ou liquide, connues 

de l'Homme du metier. 

Les anticorps polyclonaux sont prepares par immunisation d'un 
animal approprie avec une proteine ou un peptide tels que definis ci-dessus, eventuel- 
lement couple a la KLH ou a l'albumine et/ou associe a un adjuvant approprie tel que 

15 l'adjuvant de Freund (complet ou incomplet) ou lliydroxyde d'alumine ; apres obten- 
tion d'un titre en anticorps satisfaisant, les anticorps sont recoltes par prelevement du 
serum des animaux immunises et enrichis en IgG par precipitation, selon les 
techniques classiques, puis les IgG specifiques des proteines du SARS-CoV sont 
evemuellement purifiees par chromatographie d'affinite sur une colonne appropriee 

20 sur laquelle sont fixes ledit peptide ou ladite prot6ine, tels que definis ci-dessus, de 
facon a obtenir une preparation. d'IgG monospecifiques. 

Les anticorps monoclonaux sont produits a partir d'hybridomes 
obtenus par fusion de lymphocytes B d'un animal immunise par une proteine ou un 
peptide tels que definis ci-dessus avec des myelomes, selon la technique de Kohler et 

25 Milstein (Nature, 1975, 256, 495-497) ; les hybridomes sont cultives in vitro, notam- 
ment dans des fermenteurs ou produits in vivo, sous forme d'ascite ; alternativement 
lesdits anticorps monoclonaux sont produits par genie genetique comme decrit dans le 
brevet americain US 4,816,567. 

Les anticorps humanises sont produits par des methodes generates 

30 comme celles decrites dans la Demande Internationale WO 98/45332. 

Les fragments d'anticorps sont produits a partir des regions V H et 
V L donees, a partir des ARNm d'hybridomes ou de lymphocytes spleniques d'une 
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souris immunisee ; par exemple, les fragments Fv, scFv ou Fab sont exprimes a la 
surface de phages filamenteux selon la technique de Winter et Milstein (Nature, 1 991, 
349, 293-299) ; apres plusieurs etapes de selection, les fragments d'anticorps 
specifiques de Tantigene sont isoles et exprimes dans un systeme d'expression appro- 
5 prie, par les techniques classiques de clonage et ^expression d'ADN recombinant. 

Les anticorps ou leur fragments tels que definis ci-dessus, sont 
purifies par les techniques classiques connues de l'Homme du metier, telles que la 
chromatographic d'affinite. 

La presente invention a en outre pour objet l'utilisation d'un produit 

10 selectionne dans le groupe constitue par : une paire d' amorces, une sonde, une puce a 
ADN, un vecteur recombinant, une cellule modifiee, une souche isolee de coronavirus, 
un polynucleotide, une proteine ou un peptide, un anticorps ou un fragment 
d'anticorps, et une puce a proteine tels que definis ci-dessus, pour la preparation d'un 
reactif de detection et eventuellement de genotypage/serotypage, d'un coronavirus 

1 5 associe au SRAS. 

Les proteines et les peptides selon Tinvention, qui sont aptes a etre 
recormus et/ou a induire la production d'anticorps specifiques du coronavirus associe 
au SRAS, sont utiles pour le diagnostic de 1'infection par un tel coronavirus ; 
Tinfection est detectee, par une technique appropri6e- notamment EIA, ELISA, RIA, 

20 immunofluorescence-, a partir d'un echantillon biologique preleve chez un individu 
susceptible d'etre infecte. 

Selon une disposition avantageuse de ladite utilisation, lesdites 
proteines sont selectionnees dans le groupe constitu6 par les proteines S, E, M et/ou N 
et les peptides tels que definis ci-dessus. 

25 Les proteines S, E, M et/ou N et les peptides derives de ces prolines 

tels que definis ci-dessus, par exemple la prot&ne N, sont utilisees pour le diagnostic 
indirect d'une infection a coronavirus associe au SRAS (diagnostic serologique; 
detection d'anticorps specifiques du SARS-CoV), notamment par une methode 
immunoenzymatique (ELISA). 

30 Les anticorps et les fragments d'anticorps selon Tinvention, 

notamment ceux diriges contre les prolines S, E, M et/ou N et les peptides derives 
tels que definis ci-dessus, sont utiles pour le diagnostic direct d'une infection a coro- 
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navirus associe au SRAS ; la detection de proteine(s) du SARS-CoV est realis6e par 

une technique appropriee, notamraent EIA, ELISA, RIA, immunofluorescence a partir 

d'un echantillon biologique pr61eve chez un individu susceptible d'etre infecte. 

La presente invention a 6galement pour objet une methode de d6tec- 
5 tion d'un coronavirus associe au SRAS, a partir d'un echantillon biologique, laquelle 

methode est caracterisee en ce qu'elle comprend au moins : 

(a) la raise en contact dudit echantillon biologique avec au moins un 

anticorps ou un fragment d'anticorps, une proteine, un peptide ou bien une puce ou un 

filtre a proteine ou a peptide tels que definis ci-dessus, et 
10 (b) la r6velation par tout moyen approprie des complexes antigene- 

anticorps formes en (a), par exemple par EIA, ELISA, RIA, ou par immunofluores- 

cence. 

Selon un mode de mise en ceuvre avantageux dudit precede l'etape 

(a) comprend : 

l5 (a,) la mise en contact dudit echantillon biologique avec au moins un 

premier anticorps ou un fragment d'anticorps qui est fixe sur un support approprie, 
notamment une microplaque, 

(a 2 ) le lavage de la phase solide, et 

(a 3 ) l'addition d'au moins un second anticorps ou un fragment 
20 d'anticorps, different du premier, ledit anticorps ou fragment d'anticorps etant 
eventuellement marque de facon appropri6e. 

Ce procede qui permet de capturer les particules virales presentes 
dans l'6chantillon biologique est 6galement denomme procede d'immunocapture. 

Par exemple : 

25 - l'etape (ai) est realis&s avec au moins un premier anticorps mono- 

clonal ou polyclonal ou un fragment de ceux-ci, dirige contre la proteine S, M, et/ou 
E, et/ou un peptide correspondant a l'ectodomaine de l'une de ces prolines (peptides 
M2-14ouEl-12) 

- l'etape (a 3 ) est realisee avec au moins un anticorps ou un fragment 
30 d'anticorps dirige contre un autre epitope de la m6me proteine ou de preference contre 
une autre proteine, de maniere preferee contre une proteine interne telle que la nucleo- 
proteine N ou l'endodomaine de la proteine E ou M, de maniere encore plus preferee 
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il s'agit d'anticorps ou de fragments d'anticorps diriges contre la proteine N qui est 
tres abondante dans la particule virale ; lorsqu'un anticorps ou un fragment 
d'anticorps dirig6 contre une proteine interne (N) ou contre Pendodomaine des 
proteines E ou M est utilise, le dit anticorps est incube en presence de detergent, 
comme le Tween 20 par exemple, a des concentrations de 1'ordre de 0,1 %. 

- l'etape (b) de revelation des complexes antigene-anticorps formes 
est realisee, soit directement a Taide d'un second anticorps marque par exemple avec 
de la biotine ou une enzyme appropriee telle que la peroxydase ou la phosphatase 
alcaline, soit indirectement a Paide d'un serum anti-immunoglobulines marque 
comme ci-dessus. Les complexes ainsi formes sont reveles a l'aide d'un substrat 
approprie. 

La prdsente invention a en outre pour objet un kit de detection d'un 
coronavirus associe au SRAS, caracterisS en ce qu*il comprend au moins un reactif 
selectionn^ dans le groupe constitue par : une paire d'amorces, une sonde, une puce a 
ADN ou a ARN, un vecteur recombinant, une cellule modifiee, une souche isolee de 
coronavirus, un polynucleotide, une proteine ou un peptide, un anticorps, et une puce a 
proteine tels que d&finis ci-dessus. 

La pr6sente invention a en outre pour objet, une composition 
immunogene, caracterisee en ce qu'elle comprend au moins un produit selectionne 
dans le groupe constitu6 par : 

a) une proteine ou un peptide tels que definis ci-dessus, 

b) un polynucleotide de type ADN ou ARN ou 1'un de ses fragments 
representatifs tels que definis ci-dessus, de sequence choisie parmi : 

(i) la sequence SEQ ID NO : 1 ou son equivalent ARN 

(ii) la sequence hybridant dans des conditions de forte stringence 
avec la sequence SEQ ID NO : 1 , 

(iii) la sequence complementaire de la sequence SEQ ID NO : 1 ou 
de la sequence hybridant dans des conditions de forte stringence avec la sequence 
SEQ ID NO: 1, 

(iv) la sequence nucl6otidique d'un fragment repr6sentatif du poly- 
nucleotide tel que defini en (i), (ii) ou (iii), 

(v) la s6quence telle que d&finie en (i), (ii), (iii) ou (iv), modifiee, et 
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c) un vecteur d'expression recombinant comprenant un 

polynucleotide tel que d6fini en b), et 

d) une banque d'ADNc telle que definie ci-dessus, 

ladite composition immunogene etant capable d'induire une immunite humorale ou 
5 cellulaire protectee specifique du coronavirus associe au SRAS, notamment la 
production d'un anticorps dirige contre un epitope specifique du coronavirus associe 
au SRAS. 

Les proteines et les peptides tels que definis ci-dessus, notamment 
les proteines S, M, E et/ou N et les peptides derives, ainsi que les molecules d'acide 
10 nucleique (ADN ou ARN) codant lesdites proteines ou lesdits peptides, sont de bons 
candidats vaccin et peuvent etre utilisees dans des compositions immunogenes pour la 
production d'un vaccin contre le coronavirus associe au SRAS. 

Selon un mode de realisation avantageux des compositions selon 
l'invention, elles contiennent en outre, au moins un vehicule pharmaceutiquement 
IS acceptable et eventucllement des substances porteuses et/ou des adjuvants. 

Les vehicules pharmaceutiquement acceptables, les substances 
porteuses et les adjuvants sont ceux classiquement utilises. 

Les adjuvants sont avantageusement choisis dans le groupe constitue 
par des emulsions huileuses, de la saponine, des substances minerales, des extraits 
20 bacteriens, de l'hydroxyde d'alumine et le squalene. 

Les substances porteuses sont avantageusement s61ectionnees dans 
le groupe constitue par des liposomes unilamell aires, des liposomes multilamellaires, 
des micelles de saponine ou des microspheres solides de nature saccharidique ou 
aurifere. 

25 Les compositions selon l'invention, sont administrees par voie 

generate, notamment intramusculaire ou sous-cutanee ou bien par voie locale notam- 
ment nasale (aerosol). 

La presente invention a egalement pour objet l'utilisation d'une 

proteine ou d'un peptide isole ou purifie presentant une sequence selectionnee dans le 
30 groupe constitu6 par les sdquences SEQ ID NO : 3, 10, 12, 14, 17, 22, 24, 26, 28, 30, 
33 35 37 69, 70, 71, 74 et 75 pour former un complexe immun avec un anticorps 
dirige specifiquement contre un epitope du coronavirus associe au SRAS. 
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La presente invention a egalement pour objet un complexe immun 
forme d'une prot6ine ou d'un peptide isole ou purifi6 presentant une sequence selec- 
tionnee dans le groupe constitue par les sequences SEQ ID NO : 3, 10, 12, 14, 17, 22, 
24, 26, 28, 30, 33, 35, 37, 69, 70, 71, 74 et 75, et d'un anticoips dirige specifiquement 
5 contre un epitope du coronavirus associe au SRAS. 

La presente invention a egalement pour objet Putilisation d'une 
proteine ou d'un peptide isole ou purifie presentant une sequence selectionnee dans le 
groupe constitue par les sequences SEQ ID NO : 3, 1 0, 12, 14, 17, 22, 24, 26, 28, 30, 
33, 35, 37, 69, 70, 71, 74 et 75 pour induire la production d'un anticoips capable de 
1 0 reconnaitre specifiquement un epitope du coronavirus associe au SRAS. 

La presente invention a egalement pour objet Putilisation d'un poly- 
nucleotide isole ou purifie presentant une sequence selectionnee dans le groupe 
constitue par les sequences SEQ ID NO : 1, 2, 4, 7, 8, 13, 15, 16, 18, 19, 20, 31, 36 et 
38 pour induire la production d'un anticoips dirige contre la prot6ine codee par ledit 
15 polynucleotide et capable de reconnaitre specifiquement un epitope du coronavirus 
associe au SRAS 

Outre les dispositions qui precedent, l'invention comprend encore 
d'autres dispositions, qui ressortiront de la description qui va suivre, qui se refere a 
des exemples de mise en oeuvre du polynucleotide representant le genome de la 
20 souche de SARS-CoV issue du prelevement repertorie sous le numero 031589, et des 
fragments d'ADNc derives objets de la presente invention, ainsi qu'au Tableau I 
presentant la liste des sequences : 



Tableau I : Liste des sequences 



numero 
d'identification 


Sequence 


Position de 
I'ADNc en 

reference a 
Genbank 

AY274119.3 


Numero de 
depot a la CNCM 

du plasmide 
correspondant 


SEQ ID NO : 1 


genome de la 
souche issue du 
prelevement 
031589 






SEQ ID NO : 2 


ORF-S* 


21406-25348 




SEQ ID NO : 3 


Proteine S 






SEQ ID NO : 4 


ORF-S** 


21406-25348 


I-3059 


SEQ ID NO : 5 


fragment Sa 


21406-23454 


I-3020 
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SEQ ID NO : 6 
SEQ ID NO : 7 \ 
SEQ ID NO : 8 « 
SEQ ID NO : 9 
SEQ ID NO : 10 
SEQ ID NO: 11 
SEQ ID NO : 12 


fraqment Sb 
ORF-3+ORF-4* 
ORF-3+ORF-4** 
ORF3 
Proteine ORF-3 

ORF4 
Proteine ORF-4 


23322-2t>o*lo 
25110-26244 
25110-26244 

26082-26413 


1-3019 
1-3126 


SEQ ID NO: 14 
SEQ ID NO: 15 
SEQ ID NO: 16 
SEQ ID NO : 17 
SEQ ID NO: 18 

ccn in mo ■ 90 


ORF-E* 
Proteine E 

ORF-E** 

ORF-M* 
Proteine M 

ORF-M** 
ORF7 a 11* 
ORF7 a 11** 


26082-26413 
26330-27098 

26330-27098 
26977-28218 
26977-28218 


I-3046 

I-3047 
1-3125 


SEQ ID NO : 21 

F SEQ ID NO : 22 
ccn ir* MO * D*\ 


ORF7 
Proteine ORF7 
ORF8 


- 


- 

- 
- 


ccn in MO • OA 

f SEQ ID NO : 25 
ccn m mo • 9fi 


Proteine ORF8 

ORF9 
Proteine ORF9 


_ 
- 




\ SEQ ID NO : 27 


ORF10 






SEQ ID NO : 28 


Proteine ORF10 


- 


- • 


SEQ ID NO : 29 
I SEQ ID NO : 30 


ORF11 
Proteine ORF11 




- 


SEQ ID NO: 31 


OrFlab 


265-21485 




SEQ ID NO : 32 
SEQ ID NO : 33 


ORF13 
Proteine ORF13 


28130-28426 




SEQ ID NO : 34 
SEQ ID NO : 35 


ORF14 

Drntoino ORF14 


28583-28795 
28054-29430 




SEQ ID NO : 36 
SEQ ID NO : 37 
SEQ ID NO : 38 


ORF-N* 
Proteine N 
ORF-N** 


28054-29430 
1-204 


I-3048 
1-3124 


SEQ ID NO : 39 
SEQ ID NO : 40 

SEQ ID NO : 41 


5'non-codante** 
3'non-codante** 
ORFlab 
Fragment L0 


28933-29727 
30-500 


1-3123 


SEQ ID NO : 42 
SEQ ID NO : 43 
SEQ ID NO : 44 
I SEQ ID NO : 45 
SEQ ID NO : 46 
SEQ ID NO : 47 
I SEQ ID NO : 48 
| SEQ ID NO : 49 
| SEQ ID NO : 50 


Fraqment L1 
Fragment L2 
Fragment L3 
Fragment L4b 
Fragment L4 
Fragment L5 
Fragment L6 
Fragment L7 
Fragment L8 


211-2260 
2136-4187 
3892-5344 
4932-6043 
5305-7318 
7275-9176 
9032-11086 
10298-12982 
12815-14854 
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SEQ ID NO : 51 


Fraqment L9 


14745-16646 


i 


SEQ ID NO : 52 


Fragment L10 


16514-18590 


| 


SEQ ID NO : 53 


Fragment L1 1 


18500-20602 




SEQ ID NO : 54 


Fragment L12 


20319-22224 




SEQ ID NO : 55 


Amorce N sens 






SEQ ID NO : 56 


Amorce N 
antisens 


- 


- 


SEQ ID NO : 57 


Amorce S c sens 


- 


- 


SEQ ID NO : 58 


Amorce Sl sens 






SEQ ID NO : 59 


Amorce S c e t S L 
antisens 


- 


I 


SEQ ID NO : 60 


Amorce sens 
serie 1 







SEQ ID NO : 61 


Amorce antisens 
serie 1 


28774-28759 





SEQ ID NO : 62 


Amorce sens 
serie 2 


28375-28390 


- 


SEQ ID NO : 63 


Amorce antisens 
serie 2 


28702-28687 


J 


SEQ ID NO : 64 


Sonde 1 /serie 1 


28561-28586 




SEQ ID NO : 65 


Sonde 2/serie 1 


28588-28608 





SEQ ID NO : 66 


Sonde 1 /serie 2 


28541-28563 





SEQ ID NO : 67 


Sonde 2/serie 2 


28565-28 58Q 


" 1 


SEQ ID NO : 68 


Amorce ancre 
14T 







SEQ ID NO : 69 


Peptide M2-14 






SEQ ID NO : 70 


Peptide E1-12 






SEQ ID NO : 71 


Peptide E53-76 






SEQ ID NO : 72 


5'non-codante* 


1-204 




SEQ ID NO : 73 


3'non-codante* 


28933-29727 




SEQ ID NO : 74 


Proteine ORF1a 






SEQ ID NO : 75 


Proteine ORF1b 






SEQ ID NO:76-139 


Amorces 


• 





** insert clone dans le plasmide depose a la CNCM 
ainsi qu'aux dessins annexes dans lesquels : 

- la figure 1 illustre l'analyse par Western-blot de 1'expression in 
vitro des proteines recorabinantes N, S c et S L a partir des vecteurs d'expression 
pIVEX. Piste 1 : pIV2.3N. Piste 2 : pIV2.3Sc. Piste 3 : pIV2.3S L . Piste 4 : pIV2.4N. 
Piste 5 : PIV2.4S, ou pIV2.4Sc. Piste 6 : pIV2.4S L . L'expression de la proteine GFP 
exprimee a partir du meme vecteur est utilisee comme contrdle. 

- la figure 2 illustre l'analyse par electrophorese en gel de 
polyacrylamide en conditions denaturantes (SDS-PAGE) et coloration au bleu de 
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Coomassie, de l'expression in vivo de la prot6ine N a partir des vecteurs d'expression 
pIVEX. La souche VE.coli BL21(DE3)pDIA17 transformee par les vecteurs pIVEX 
recombinants est cultiv6e a 30°C dans du milieu LB, en presence ou en l'absence 
d'inducteur (IPTG ImM). Piste 1 : pIV2.3N Piste 2 : pIV2.4N. 
5 - la figure 3 illustre l'analyse par electrophorese en gel de 

polyacrylamide en conditions denaturantes (SDS-PAGE) et coloration au bleu de 
Coomassie, de l'expression in vivo des polypeptides S L et S c a partir des vecteurs 
d'expression pIVEX. La souche d'E.coli BL21(DE3)pDIA17 transformee par les 
vecteurs pIVEX recombinants est cultivee a 30°C dans du milieu LB, en presence ou 
10 en l'absence d'inducteur (IPTG ImM). Piste 1 : pIV2.3Sc Piste 2 : pIV2.3S L . Piste 3 : 

plV2.4Si Piste 4 : pF/2.4S L . 

- la figure 4 illustre l'activit6 antigenique des proteines N, S L et S c 
recombinantes produites dans la souche E coli BL21(DE3)pDIA17 transformer par 
les vecteurs pIVEX recombinants. A : electrophorese (SDS-PAGE) des lysats bacte- 

15 riens.B et C : Westem-blot avec les serums, provenant d'un meme patient infecte par 
le SARS-CoV, preleves respectivement 8 jours (B : serum Ml 2) et 29 jours-(C : 
serum M13) apres le debut des sympt6mes du SRAS. Piste 1 : pIV2.3N. Piste 2 : 
pIV2.4N. Piste 3 : pIV2.3S c . Piste 4 : pIV2.4 S,. Piste 5 : pIV2.3S L . Piste 6 : pIV2.4S L 

- la figure 5 illustre la purification sur colonne Ni-NTA agarose de la 
20 proteine N recombinante produite dans la souche E. coli BL21(DE3)pDIA17 a partir 

du vecteur plV2.3N. Piste 1 : Extrait bacterien total. Piste 2 : Extrait soluble. Piste 3 : 
Extrait insoluble. Piste 4 : Extrait depose sur la colonne Ni-NTA. Piste 5 : proteines 
non-retenues. Piste 6 : Fractions du pic 1 . Piste 7 : Fractions du pic 2. 

- la figure 6 illustre la purification de la proteine S c recombinante a 
25 partir des corps d'inclusions produits dans la souche E. coli BL21(DE3)pDIA17 trans- 
formee par le P rV2.4S,.A. Traitement au Triton X-100 (2%) : Piste 1 : Extrait 
bact6rien total. Piste 2 : Extrait soluble. Piste 3 : Extrait insoluble. Piste 4 : Surnageant 
apres traitement au Triton X-100 (2 %). Pistes 5 et 6 : Culot apres traitement au Triton 
X-100 (2 %).B : Traitement a l'uree 4M, 5M, 6M et 7M des extraits solubles et inso- 

30 lubles. 
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- la figure 7 repr6sente 1'immunoempreinte realisee a Faide d'un 
lysat de cellules infect6es par le SARS-CoV et d'un serum de patient atteint de 
pneumopathie atypique. 

- la figure 8 reprdsente des immunoempreintes realisees a 1'aide 
5 d'un lysat de cellules infectees par le SARS-CoV et d'immuns6rums de lapins sp£ci- : 

fiques de la nucleoproteine N (A) et de la prot&ne de spicule S (B). LS. : serum 
immun. p.i. : serum pre-immun. LMmmunserum anti-N a ete utilise au 1/50000 et 
Fimmunserum anti-S au 1/10000. 

- la figure 9 illustre la r6activite en ELISA des serums polyclonaux 
10 monospScifiques de lapin diriges contre la proteine N ou le fragment court de la 

proline S (Sc), vis-a-vis des prot6ines recombinantes correspondantes utilisees pour 
l'immunisation. A : lapins PI 3097, PI 3081, et PI 3031 immunises avec la proteine N 
recombinante purifie. B : lapins PI 1135, PI 3042, et P14001 immunises avec une 
preparation de corps d'inclusions correspondants au fragment court de la proteine S 
15 (Sc)* LS. : serum immun. p.i. : serum pre-immun. 

- la figure 10 illustre la reactivite en ELISA de la proteine N 
recombinante purifite, vis-a-vis de serum de patients atteints de pneumonie atypique 
causee par le SARS-CoV. Figure 10a : plaques ELISA prepares avec la proteine N a la 
concentration de 4 pg/ml et 2 jig/ml. Figure 10b : plaque ELISA preparee avec la 

20 proline N a la concentration de 1 jig/ml Les serums designes A, B, D, E, F, G, H 
correspondent a ceux du Tableau IV. 

- la figure 11 illustre F amplification par RT-PCR de quantity 
decroissantes d'ARN synthetique du g&ie N du SARS-CoV (10 7 k 1 copie), a Faide 
des couples d'amorces n° 1 (N/+/28507,N/-/28774) (A) et n° 2 (N/+/28375,N/-/28702) 

25 (B). T : amplification realisee en Tabsence d ! ARN. MW : marqueur d ! ADN. 

- la figure 12 illustre F amplification par RT-PCR en temps r6el 
d'ARN synthetique du gene N du SARS-CoV : des quantites decroissantes d'ARN 
synthetique en repliquat (repli. ; pistes 16 a 29) ainsi que de PARN viral dilue au 
1/20x10"* (piste 32) ont 6te amplifies par RT-PCR en temps reel a l'aide du kit "Light 

30 Cycler RNA Amplification Kit Hybridization Probes" et des couples d f amorces et de 
sondes de la s6rie n° 2, dans les conditions dScrites a Fexemple 7. 
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- la figurel3 (figure 13.1 a 13.70) represente la carte de restriction 
de la sequence SEQ ID NO : 1 correspondant a l'equivalent ADN du genome de la 
souche de SARS-CoV issue du prelevement repertorie sous le numero 031589. 

II doit etre bien entendu, toutefois, que ces exemples sont donnes 
5 uniquement a titre d'illustration de l'objet de l'invention, dont ils ne constituent en 
aucune maniere une limitation. 

Exemple 1 : Clonage et sequencage du genome de la souche de SARS-CoV issue 
du prelevement repertorie sous le numero 031589 

L'ARN de la souche de SARS-CoV a ete extrait a partir du prele- 
1 0 vement de lavage bronchoalveolaire repertori6 sous le numero 03 1 589, effectue sur un 
patient de l'hdpital francais de Hanoi (Vietnam) atteint de SRAS. 

L'ARN isol6 a ete utilise comme matrice pour amplifier les ADNc 
correspondant aux differents cadres ouverts de lecture du genome (ORF la, ORFlb, 
ORF-S, ORF-E, ORF-M, ORF-N (incluant les ORF-13 et ORF-14), ORF3, ORF4, ^ 
1 5 ORF7 a ORF1 1), et aux extremites 5' et 3' non-codantes. Les sequences des amorces 

et des sondes utilisees pour 1' amplification/detection ont et6 d6finies d'apres la ± 
sdquence nucleotidique disponible du SARS-CoV. ^ 

Dans ce qui suit les amorces et les sondes sont identifies par : la 
lettre S, suivie d'une lettre qui indique la region correspondante du genome (L pour 
20 I'extremite 5'incluant ORFla et ORFlb ; S, M et N pour les ORF-S, ORF-M, ORF-N, 
SE et MN pour les regions intergeniques correspondantes), puis 6ventuellement de Fn, 
Rn, avec n inclus entre 1 et 6 correspondant aux amorces utilisees pour la PCR nichee 
ou imbriquee (paire Fl + Rl pour la premiere amplification, paire F2 + R2 pour la 
deuxieme amplification, etc. . .), puis de /+/ ou l-l correspondant a une amorce sens ou 
25 antisens et enfin des positions des amorces en r6ference a la sequence Genbank 
AY274U.3 ; pour les amorces S et N sens et antisens et les autres amorces sens 
uniquement, lorsqu'une seule position est indiquee elle correspond a celle de 
I'extremite 5' d'une sonde ou d'une amorce d'environ 20 bases ; pour les amorces 
antisens autres que les amorces S et N, lorsqu'une seule position est indiquee elle 
30 correspond a celle de I'extremite 3' d'une sonde ou d'une amorce d'environ 20 bases. 

Les produits d' amplifications ainsi generes ont 6t6 sequences a 
l'aide d'amorces sp6cifiques afin de determiner la sequence complete du genome de la 
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scmche de SARS-CoV issue du pr&evement repertori6 sous le numero 031589. Ces 
produits d' amplification, k F exception de ceux correspondant aux ORFla et ORFlb, 
ont ensuite 6te clones dans des vecteurs d' expression afin de produire les prolines 
virales correspondantes et les anticorps diriges contre ces prolines, notamment par 
5 immunisation a base d'ADN. 

1, Extraction des ARN 

Les ARN ont 6te extraits a Faide du kit QJamp viral RNA extraction 
mini (QIAGEN) en suivant les recommandations du fabricant De maniere plus 
pr6cise : 140 ^il du prelevement et 560 fxl de tampon AVL ont ete melanges vigoureu- 

10 sement pendant 15 secondes, incubes 10 min a temperature ambiante puis centrifuges 
brievement a vitesse maximale. 560 |il d'ethanol a 100% ont 6te ajoutes au surnageant 
et le melange ainsi obtenu a 6te agit6 tres vigoureusement pendant 15 sec. 630 jxl du 
melange ont ensuite et6 deposes sur la colonne. 

La colonne a ete placee sur un tube de 2 ml, centrifugee 1 min a 

15 8000 rpm, puis le reste du melange precedent a ete depose sur la meme colonne, 
centrifuge a nouveau, 1 min a 8000 rpm et la colonne a et6 transferee sur un tube de 2 
ml propre. Ensuite, 500 fxl de tampon AW1 ont ete ajoutes sur la colonne, puis la 
colonne a ete centrifugee 1 min a 8000 rpm et l'61uat a ete elimine. 500 p.1 de tampon 
AW2 ont ete ajoutes sur la colonne qui a ensuite ete centrifugee 3 min h 14000 rpm et 

20 transferee sur un tube de 1,5 mL Enfin, 60 |al de tampon AVE ont ete ajoutes sur la 
colonne qui a ete incubee 1 a 2 min a temperature ambiante puis centrifugee 1 min a 
8000 rpm. L'eluat correspondant a TARN purifie a ete recuperS et congele a -20°C. 

2, Amplification, sequencage et clonage des ADNc 
2 J) ADNc codant pour la proteine S 

25 Les ARN extraits a partir du prelevement ont ete soumis a une trans- 

cription inverse a Faide d'oligonucl^otides hexam6riques de sequence al6atoire 
(pdN6), afin de produire des fragments d'ADNc. 

La sequence codant pour la glycoprotein S du SARS-CoV a 6te 
amplifiee sous la forme de deux fragments d'ADN chevauchants : fragment 5' 

30 (SRAS-Sa, SEQ ID NO:5) et fragment 3'(SRAS-Sb, SEQ ID NO:6), en r^alisant deux 
amplifications successives a Faide d'amorces imbriquees. Les amplicons ainsi obtenus 
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ont ete sequences, clones dans le vecteur plasmidique PCR 2.1-TOPO™ (IN 

VTTROGEN), puis la sequence des ADNc clones a ete determinee. 

a y.1nna pe et seauencase des fra gments Sa et Sb 

ai) synthese de l'ADNc 
5 Le melange reactionnel contenant : ARN (5 , H 2 0 ppi (3,5 ul), 

tampon de transcriptase inverseSX (4 ul,), dNTP 5 mM (2 p.1), pdN6 100 ug/ml (4 ul), 
RNasin 40 UI/ul (0,5 ul) et transcriptase inverse AMV-RT, 10 UI/ul, PROMEGA 
(lul) a ete incube dans un thermocycleur dans les conditions suivantes : 45 min a 
42°C, 15 min a 55°C, 5 min a 95°C, puis l'ADNc obtenu a ete maintenu a +4°C. 

10 a 2 ) premiere amplification. PCR 

Les extremites 5' et 3' du gene S ont ete amplifies respectivement 
avec les paires d'amorces S/F1/+/ 21350-21372 et S/Rl/-/ 23518-23498, S/F3/+/ 
23258-23277 et S/R3/-/253 82-253 63. Le melange reactionnel de 50 ul contenant : 
ADNc (2 ul), amorces 50 uM (0,5 p.1), tampon 10 X (5 ul), dNTP 5 mM (2 ul), Taq 

15 Expand High Fidelity, Roche (0,75 ul) et H 2 0 (39, 75 ul) a ete amplifie dans un 
thermocycleur, dans les conditions suivantes: une etape initiale de denaturation a 
94°C pendant 2 min a et6 suivie de 40 cycles comprenant : une etape de denaturation a 
94°C pendant 30 sec, une etape d'hybridation a 55°C pendant 30 sec puis une etape 
d'elongation a 72°C pendant 2 min 30 sec, avec 10 sec d'61ongation supplementaire a 

20 chaque cycle, puis d'une etape finale d'elongation a 72°C pendant 5 min. 

a3) deuxi^me.ampHfica^ 

Les produits de la premiere amplification PCR (amplicons 5' et 3') 
ont subi une seconde 6tape d' amplification PCR (PCR nich6e) dans des conditions 
identiques a celles de la premiere amplification, avec les paires d'amorces 
25 S/F2/+/21406-21426 et S/R2/-/23454-23435, et S/F4/+/23322-23341 et S/R4/-/25348- 
25329, respectivement pour Tamplicon 5' et l'amplicon 3'. 
a4).clpnageetsiquenca5edes.^ 

Les amplicons Sa (extremit6 5') et Sb (extremite 3') ainsi obtenus ont 
ete purifies a l'aide du kit QIAquick PCR purification (QIAGEN), en suivant les 
30 recommandations du fabricant, puis ils ont ete clones dans le vecteur PCR2.1-TOPO 
(kit Invitrogen), pour donner les plasmides denommes SRAS-S1 et SRAS-S2. 
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L'ADN des clones Sa et Sb a et6 isol6 puis Tinsert correspondant a 
ete sequence a Paide du Kit Big Dye, Applied Biosystem® et des amorces univer- 
selles Ml 3 forward et Ml 3 reverse, ainsi que des amorces: S/S/-+/21867, 
S/S/+/22353, S/S/+/22811, S/S/+/23754, S/S/+/24207, S/S/+/24699, S/S/+/24348, 
5 S/S/724209, S/S/-/23630, S/S/-/23038, S/S/-/22454, S/S/-/21815, S/S/-/24784, - 
S/S/+/21556, S/S/+/23130 et S/S/+/24465, en suivant les instructions du fabricant ; les 
sequences des fragments Sa et Sb ainsi obtenues correspondent aux sequences SEQ ID 
NO :5 et SEQ ID NO :6 dans la liste de sequences jointe en annexe. 

Le plasmide, denomm6 SARS-S1 a et6 depose sous le n° 1-3020, le 

10 12 mai 2003, auprSs de la Collection Nationale de Cultures de Microorganismes, 25 
rue du Docteur Roux, 75724 Paris Cedex 15 ; il contient un fragment 5 5 de la 
sequence du gene S de la souche de SARS-CoV issue du prelevement repertorie sous 
le n° 031589, telle que definie ci-dessus, lequel fragment denommS Sa correspondant 
aux nucleotides des positions 21406 a 23454 (SEQ ID NO :5), en reference a la 

1 5 sequence Genbank AY2741 1 9.3 Tor2. 

Le plasmide, denomme TOP10F'-SARS-S2 a 6te depose sous le n° 
1-3019, le 12 mai 2003, aupres de la Collection Nationale de Cultures de 
Microorganismes, 25 rue du Docteur Roux, 75724 Paris Cedex 15 ; il contient un 
fragment 3'de la sequence du gene S de la souche de SARS-CoV issue du prSleve- 

20 ment repertorie sous le n° 031589, telle que definie ci-dessus, lequel fragment 
d6nomme Sb correspondant aux nucleotides des positions 23322 a 25348 (SEQ ID 
NO : 6), en reference a la sequence Genbank n° d'acces AY2741 19.3. 
b) clonage et sequencage de TADNc complet (clone SRAS-S de 4 kb) 

L'ADNc S complet a ete obtenu a partir des clones SARS-S1 et 

25 SARS-S2 precites, de la fa9on suivante : 

1) une r6action d'amplification PCR a ete realisee sur un clone 
SARS-S2 en presence de Pamorce S/R4/-/25348-25329 precitee et de Pamorce 
S/S/+/24696-24715: un amplicon de 633 bp a et6 obtenu, 

2) une autre reaction d'amplification PCR a ete realisee sur un autre 
30 clone SARS-S2, en presence des amorces S/F4/+/23322-23341 pr6citee et S/SA 

/24803-24784: un amplicon de 1481 pb a ete obtenu, 
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La reaction d' amplification a ete realisee dans les conditions telles 
que defmies ci-dessus pour 1' amplification des fragments Sa et Sb, a l'exception que 
30 cycles d'amplifications comprenant une etape de denaturation a 94° C pendant 20 
sec et une etape d'elongation a 72° C pendant 2 min 30 sec ont ete effectues. 
5 3) les 2 amplicons (633 pb et 1481 pb) ont ete purifUs dans les 

conditions telles que defmies ci-dessus pour les fragments Sa et Sb. 

4) une autre reaction d' amplification PCR a l'aide des amorces 
S/F4/+/23322-23341 et S/R4/-/25348-25329 precitees, a ete realisee sur les amplicons 
purifies obtenus en 3). La reaction d' amplification a ete realisee dans les conditions 
10 telles que defmies ci-dessus pour 1' amplification des fragments Sa et Sb, a l'exception 
que 30 cycles d'amplifications ont ete effectues. 

L'amplicon de 2026 pb ainsi obtenu a ete purifi6, clon6 dans le 
vecteur PCR2.1-TOPO puis sequenc6 comme ci-dessus, a l'aide des amorces telles 
que defmies ci-dessus pour les fragments Sa et Sb. Le clone ainsi obtenu a ete 

1 5 denomme clone 3' . 

5) Le clone SARS-S1 precedemment obtenu et le clone 3 'ont ete 
digeres par EcoR I, les bandes d' environ 2kb ainsi obtenues ont ete purifiees sur gel 
puis amplifies par PCR avec les amorces S/F2/+/2 1406-2 1426 et S/R4/-/25348- 
25329 precitees. La reaction d' amplification a ete realisee dans les conditions telles 

20 que defmies ci-dessus pour l'amplification des fragments Sa et Sb, a l'exception que 
30 cycles d'amplifications ont ete effectues. L'amplicon d'environ 4 kb a ete purine et 
sequence. II a ensuite ete clone dans le vecteur PCR2.1-TOPO pour donner le 
plasmide, denomme SARS-S, et l'insert contenu dans ce plasmide a ete sequence 
comme ci-dessus, a l'aide des amorces telles que definies ci-dessus pour les fragments 

25 Sa et Sb. Les sequences d'ADNc de l'insert et de l'amplicon codant pour la proteine 
S, correspondent respectivement aux sequences SEQ ID NO : 4 et SEQ ID NO : 2 
dans la liste de sequences jointe en annexe, elles codent pour la protSne S (SEQ ID 
NO : 3). 

La sequence de l'amplicon correspondant a l'ADNc codant pour la 
30 proteine S de la souche de SARS-CoV issue du prelevement n°031589 presente les 
deux mutations suivantes par rapport aux sequences correspondantes de respective- 
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ment les isolats Tor2 et Urbani, les positions des mutations etant indiqu6es en refe- 
rence a la sequence complete du g6nome de Tisolat Tor2 (Genbank AY2741 193) : 

- g/t en position 23220 ; le codon alanine (get) en position 577 de la 
sequence en acides amines de la proline S de Tor2 est remplace par un codon serine 

5 (tot), 

- c/t en position 24872 : cette mutation ne modifie pas la sequence 
en acides amines de la proteine S, et 

Le plasmide, denomme SARS-S, a ete depose sous le n° 1-3059, Ie 
20 juin 2003, aupres de la Collection Nationale de Cultures de Microorganisrnes, 25 

10 rue du Docteur Roux, 75724 Paris Cedex 15 ; il contient la sequence d'ADNc codant 
pour la proteine S de la souche de SARS-CoV issue du prelevement repertorie sous le 
n° 031589, laquelle sequence correspondant aux nucleotides des positions 21406 a 
25348 (SEQ ID NO :4), en reference a la sequence Genbank AY2741 1 9.3. 
2.2) ADNc codant pour les proteines M et E 

15 Les ARN issus du prelevement 031589, extraits comme ci-dessus, 

ont ete soumis a une transcription inverse, associee, lors de la meme etape (kit Titan 
One Step RT-PCR®, Roche), a une reaction ^amplification par PCR, a l'aide des 
couples d' amorces : 

- S/E/F1/+/2605 1-26070 et S/E/R1/-/26455-26436 pour amplifier l'ORF-E, et 
20 - S/M/F1/+/26225-26244 et S/M/R1/-/27 148-27 129 pour amplifier l'ORF-M. 

Un premier melange r6actionnel contenant : 8,6 jul d'H 2 Oppi, 1 jil de 
dNTP (5mM), 0,2 pi de chacune des amorces (50pM), 1,25 pi de DTT (lOOmM) et 
0,25 pi de RNAsin (40UI/pl) a 6t6 combine avec un deuxieme melange r^actionnel 
contenant : 1 pi d'ARN, 7 pi d'H 2 Oppi, 5 pi de tampon de RT-PCR 5X et 0,5 pi de 
25 melange d'enzyme et les melanges combines ont ete incubes dans un thermocycleur 
dans les conditions suivantes : 30 min a 42°C, 10 min a 55°C, 2 min a 94°C suivi de 
40 cycles comprenant une etape de d6naturation a 94°C pendant 10 sec, une etape 
d'hybridation a 55°C pendant 30 sec et une etape d'elongation a 68°C pendant 45 sec, 
avec 3 sec d'increment par cycle et enfin une etape d'elongation terminale a 68°C 
30 pendant 7 min. 
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Les produits d' amplification ainsi obtenus (amplicons M et E) ont 
subi une deuxieme amplification PCR (PCR nichee) en utilisant le kit Expand High- 
Fi®, Roche), a l'aide des couples d' amorces : 

- S/E/F2/+/26082-26101 et S/E/R2/-/26413-26394 pourl'amplicon E, et 
5 - S/M/F2/+/26330-26350 et S/M/R2/-/27098-27078 pour l'amplicon M. 

Le m61ange reactionnel contenant : 2 pi du produit de la premiere PCR, 39,25 pi 
d'H 2 Oppi, 5 pi de tampon 10X contenant du MgCl 2 , 2 pi de dNTP (5mM), 0,5pl de 
chacune des amorces (50 pM) et 0,75pl de melange d'enzyme a ete incub6 dans un 
thennocycleur dans les conditions suivantes : une etape de denaturation a 94°C 
10 pendant 2 min a ete suivie de 30 cycles comprenant une etape de denaturation a 94°C 
pendant 15 sec, une etape d'hybridation a 60°C pendant 30 sec et une etape 
d'elongation a 72°C pendant 45 sec, avec 3 sec ^increment par cycle, et enfin une 
etape d'elongation terminale a 72°C pendant 7 min. Les produits d'amplification 
obtenus correspondant aux ADNc codant pour les prolines E et M ont ete sequences 
15 comme ci-dessus, a l'aide des amorces: S/E/F2/+/26082 et S/E/R2/-/26394, 
S/M/F2/+/26330, S/M/R2/-/27078 precitees et des amorces S/M/+/26636-26655 et 
S/M/-/26567-26548. lis ont ensuite ete clones, comme ci-dessus, pour donner les 
plasmides denommes SARS-E et SARS-M. L'ADN de ces clones a ensuite ete isole et 
sequence a l'aide des amorces universelles Ml 3 forward et Ml 3 reverse ainsi que des 
20 amorces S/M/+/26636 et S/M/-/26548 precitees. 

La sequence de l'amplicon representant l'ADNc codant pour la 
proteine E (SEQ ID NO : 13) de la souche de SARS-CoV issue du prelevement 
n°031589 ne comporte pas de differences par rapport aux sequences correspondantes 
des isolats AY274119.3-Tor2 et AY278741-Urbani. La sequence de la proline E de 
25 la souche de SARS-CoV 031589 correspond a la sequence SEQ ID NO : 14 dans la 
liste de sequences jointe en annexe. 

Le plasmide, denomme SARS-E a ete depose sous le n° 1-3046, le 
28 mai 2003, aupres de la Collection Nationale de Cultures de Microorganismes, 25 
rue du Docteur Roux, 75724 Paris Cedex 15 ; il contient la sequence d'ADNc codant 
30 pour la proteine E de la souche de SARS-CoV issue du prelevement repertorie sous le 
n° 031589, telle que definie ci-dessus, laquelle sequence correspondant aux 
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nucleotides des positions 26082 a 26413 (SEQ ID NO :15), en reference a la s6quence 
Genbank n° d'acces AY2741 19.3. 

La sequence de l'amplicon representant TADNc codant pour la M 
(SEQ ID NO :16) de la souche de SARS-CoV issue du prelevement n°031589 ne 
5 comporte pas de differences par rapport a la sequence correspondante de l'isolat 
AY274119.3-Tor2. En revanche, en position 26857, 1'isolat AY278741-Urbani 
comporte un c et la sequence de la souche de SARS-CoV issue du prelevement reper- 
torie sous le n°031589 un t. Cette mutation aboutit a une modification de la sequence 
en acides amines de la proteine correspondante: en position 154, une proline 

10 (AY278741-Urbani) est changee en serine dans la souche de SARS-CoV issue du 
prelevement repertori6 sous le n°031589. La sequence de la proline M de la souche 
de SARS-CoV issue du prelevement repertorie sous le n°031589 correspond a la 
sequence SEQ ID NO :1 7 dans la liste de sequences jointe en annexe. 

Le plasmide, denomme SARS-M a ete depose sous le n° 1-3047, le 

15 28 mai 2003, aupres de la Collection Nationale de Cultures de Microorganismes, 25 
rue du Docteur Roux, 75724 Paris Cedex 15 ; il contient la sequence d'ADNc codant 
pour la proteine M de la souche de SARS-CoV issue du prelevement repertorie sous le 
n° 031589, telle que definie ci-dessus ; laquelle sequence correspondanf aux 
nucleotides des positions 26330 a 27098 (SEQ ID NO :1 8), en reference a la sequence 

20 Genbank n° d'acces AY2741 19.3. 

2.3) ADNc correspondant aux ORJF3, ORF4, ORF7 a ORF11 

La m6me strategic d'amplification, de clonage et de sequen9age a ete 
utilisee pour obtenir les fragments d'ADNc correspondant respectivement aux ORF 
suivantes: ORF 3, ORF4, ORF7, ORF8, ORF9, ORF10 et ORF11. Les couples 

25 d'amorces utilisees pour la premiere amplification sont : 

- ORF3 et ORF4 : S/SE/F 1/4-/25069-25088 et S/SE/R1 A/26300-26281 

- ORF7 a ORF1 1 : S/MN/F1/+/26898-26917 et S/MN/R1 A/28287-28266 

Les couples d'amorces utilisees pour la deuxieme amplification sont : 

- ORF3 et ORF4 : S/SE/F2/+/251 10-25129 et S/SE/R2A/26244-26225 
30 - ORF7 a ORF1 1 : S/MN/F2/+/26977-26996 et S/MN/R2A/282 1 8-28 1 99 

Les conditions de la premiere amplification (RT-PCR) sont les 
suivantes : 45 min a 42°C, 1 0 min a 55°C, 2 min a 94°C suivi de 40 cycles compre- 
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nant une etape de denaturation a 94°C pendant 15 sec, une 6tape d'hybridation a 58°C 
pendant 30 sec et une etape d'elongation a 68°C pendant 1 rain, avec 5 sec d'incre- 
ment par cycle et enfin une etape d'elongation terminale a 68°C pendant 7 rain. 
Les conditions de la PCR nich6e sont les suivantes : une etape de denaturation a 94°C 
pendant 2 min a ete suivie de 40 cycles comprenant une etape de denaturation a 94°C 
pendant 20 sec, une etape d'hybridation a. 58°C pendant 30 sec et une etape 
d'elongation a 72°C pendant 50 sec, avec 4 sec ^increment par cycle et enfin une 
etape d'elongation terminale a 72°C pendant 7 min. 

Les produits d'amplification obtenus correspondant aux ADNc 
contenant respectivement les ORF3 et 4 et les ORF7 a 11 ont ete sequences a l'aide 
des amorces: S/SE/+/25363, S/SE/+/25835, S/SE/-/25494, S/SE/-/25875, 
S/MN/+/27839, S/MN/+/27409, S/MN/-/27836 S/MN/-/27799 et clon6s comme ci- 
dessus pour les autres ORF, pour donner les plasmides d6nommeS SARS-SE et 
SARS-MN. L'ADN de ces clones a ete isole et sequence a l'aide de ces memes 
amorces et des amorces universelles Ml 3 sens et Ml 3 anti-sens. 

La sequence de l'amplicon representant 1' ADNc de la region conte- 
nant les ORF 3 et 4 (SEQ ID NO :7) de la souche de SARS-CoV issue du prelevement 
n°031589 comporte une difference nucl6otidique par rapport a la sequence corres- 
pondante de l'isolat AY2741 19-Tor2. Cette mutation en position 25298 aboutit a une 
modification de la sequence en acides amin6s de la proteine correspondante (ORF 3): 
en position 11, une arginine (AY274119-Tor2) est changee en glycine dans la souche 
de SARS-CoV issue du prelevement n°031589. En revanche, aucune mutation n'a ete 
identifiee par rapport a la sequence correspondante de l'isolat AY278741-Urbani. Les 
sequences des ORF 3 et 4 la souche de SARS-CoV issue du prelevement n°031589 
correspondent respectivement aux sequences SEQ ID NO :10 et 12 dans la liste de 

sequences jointe en annexe. 

Le plasmide, d6nomme SARS-SE a et6 depose sous le n° 1-3126, le 
13 novembre 2003, aupres de la Collection Nationale de Cultures de 
Microorganismes, 25 rue du Docteur Roux, 75724 Paris Cedex 15; il contient 
l'ADNc correspondant a la region situ6e entre l'ORF-S et FORF-E et chevauchant 
l'ORF-E de la souche de SARS-CoV issue du prelevement repertorie sous le n° 
031589, telle que definie ci-dessus, laquelle region correspondant aux nucleotides des 
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positions 25110 a 26244 (SEQ ID NO :8), en reference a la sequence Genbank n° 
d'accesAY274119.3, 

La sequence de 1'amplicon representant 1'ADNc correspondant a la 
region contenant les ORF7 a ORF11 (SEQ ID NO :19) de la souche de SARS-CoV 
5 issue du prelevement n°031589 ne comporte pas de differences par rapport aux 
sequences correspondantes des isolats AY2741 19-Tor2 et AY278741-Urbani. Les 
sequences des ORF7 a 1 1 de la souche de SARS-CoV issue du prelevement n°031589 
correspondent respectivement aux sequences SEQ ID NO : 22, 24, 26, 28 et 30 dans la 
liste de sequences jointe en annexe. 

10 Le plasmide denomme SARS-MN a ete depose sous le n° 1-3125, le 

13 novembre 2003, aupres de la Collection Nationale de Cultures de 
Microorganismes, 25 rue du Docteur Roux, 75724 Paris Cedex 15; il contient la 
sequence d'ADNc correspondant a la region situee entre FORF-M et TORF-N de la 
souche de SARS-CoV issue du prelevement repertorie sous le n° 031589 et prelevee a 

15 Hanoi, telle que definie ci-dessus, laquelle sequence correspondant aux nucleotides 
des positions 26977 a 28218 (SEQ ID NO :20 ), en reference a la sequence Genbank 
n°d'acces AY274119.3. 

La sequence de I'amplicon representant l'ADNc correspondant a la 
region contenant les ORF7 a ORF1 1 (SEQ ID NO :19) de la souche de SARS-CoV 

20 issue du prelevement n°031589 ne comporte pas de differences par rapport aux 
sequences correspondantes des isolats AY2741 19-Tor2 et AY278741-Urbani. Les 
sequences des ORF7 a 1 1 de la souche de SARS-CoV issue du prelevement n°031589 
correspondent respectivement aux sequences SEQ ID NO : 22, 24, 26, 28 et 30 dans la 
liste de sequences jointe en annexe, 

25 2.4) ADNc codant pour la proteine N et incluant les ORF13 et ORF14 

L'ADNc a et6 synthetase et amplifie comme decrit ci-dessus pour les 
fragments Sa et Sb. De maniere plus precise, le melange reactionnel contenant : 5 jul 
d'ARN, 5 pi d'HfeO ppi 4 p.1 de tampon de reverse transcriptase 5X, 2 \i] de dNTP (5 
mM), 2 Jul d'oligo 20T (5 jiM), 0,5 [il de RNasin (40 UI/ul) et 1, 5 jul de AMV-RT (10 

30 UI/ul Promega) a et6 incube dans un thermocycleur dans les conditions suivantes : 45 
min a 42°C, 15 min a 55°C, 5 min a 95°C, puis il a 6t6 maintenu a +4°C. 



38 

Une premiere amplification PCR a ete realisee avec la paire 
d'amorces S/N/F3/+/28023 et S/N/R3/-/29480. 

Le melange r6actionnel comrae ci-dessus pour 1' amplification des 
fragments SI et S2 a ete incube dans un thermocycleur, dans les conditions suivantes : 
5 une 6tape initiale de denaturation a 94°C pendant 2 min a ete suivie de 40 cycles 
comprenant une etape de denaturation a 94°C pendant 20 sec, une 6tape d'hybridation 
a 55°C pendant 30 sec puis une &ape d' elongation a 72°C pendant 1 min 30 sec avec 
10 sec d'elongation supplemental a chaque cycle, puis d'une etape finale 
d'elongation a 72°C pendant 5 min. 
l0 L'amplicon obtenu a la premiere amplification PCR a subi une 

seconde etape d' amplification PCR (PCR nichee) avec la paires d'amorce 
S/N/F4/+/28054 et S/N/R4/-/29430 dans des conditions identiques a celles de la 

premiere amplification. 

Le produit d' amplification obtenu correspondant a l'ADNc codant 
1 5 pour la proteine N de la souche de S ARS-CoV issue du prelevement n°03 1 589a ete 
sequence a l'aide des amorces : S/N/F4/+/28054, S/N/R4/-/29430, S/N/+/28468, 
S/N/+/28918 et S/N/-/28607 et clone comme ci-dessus pour les autres ORF, pour 
donner le plasmide denomme SARS-N. L'ADN de ces clones a ete isole et sequence a 
l'aide des amorces universelles M13 sens et Ml 3 anti-sens, ainsi que des amorces 
20 S/N/+/28468, S/N/+/289 1 8 et S/N/-/28607. 

La s6quence de l'amplicon representant l'ADNc correspondant a 
l'ORF-N et incluant les ORF13 et ORF14 (SEQ ID NO :36) de la souche de SARS- 
CoV issue du prelevement n°031589 ne comporte pas de differences par rapport aux 
s6quences correspondantes des isolats AY2741 19.3-Tor2 et AY278741-Urbani. La 
25 s6quence de la proteine N de la souche de SARS-CoV issue du prelevement n°03 1 589 
correspond a la sequence SEQ ID NO : 37 dans la liste de sequences jointe en annexe. 

Les sequences des ORF13 et 14 de la souche de SARS-CoV issue du 
pr61evement n°031589 correspondent respectivement aux sequences SEQ ID NO : 32 
et 34 dans la liste de sequences jointe en annexe. 
30 Le plasmide denomme SARS-N a ete depose sous le n° 1-3048, le 5 

juin 2003, aupres de la Collection Nationale de Cultures de Microorganismes, 25 rue 
du Docteur Roux, 75724 Paris Cedex 15 ; il contient l'ADNc codant pour la proteine 
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N de la souche de S ARS-CoV issue du prelevement repertorie sous le n° 031 589, telle 
que definie ci-dessus, laquelle sequence correspondant aux nucleotides des positions 
28054 a 29430 (SEQ ID NO :38), en reference a la sequence Genbank n° d'acces 
AY274 119.3. 
5 2.5) extremites 5' et 3' non-codantes 
a) extremite 5'non-codante (5'NC) 
ai) synthese de FADNc 

Les ARN issus du prelevement 031589, extraits comme ci-dessus, 
ont ete soumis a une transcription inverse dans les conditions suivantes : 
10 L'ARN (15 pi) et l'amorce S/L/-/443 (3 pi a la concentration de 

5pm, ont ete incubes 1 0 min k 75°C. 

Ensuite, du Tampon de transcriptase inverse 5X (6 pi, 
INVITROGEN), des dNTP 10 mM (1 pi), du DTT 0,1M (3 pi) ont ete ajout6s et le 
melange a ete incube a 50°C pendant 3 min. 
15 Enfin la transcriptase inverse (3 pi de Superscript®, INVITROGEN) 

a ete ajoutee au melange precedent qui a ete incube a 50°C pendant lh30 puis h 90 °C 
pendant 2 min. 

L'ADNc ainsi obtenu a ete purifi6 a l'aide du kit QIAquick PCR 
purification (QIAGEN), selon les recommandations du fabricant 

20 bj) Reaction h^.lj?mamiJm)§f^mP. (TdT) 

L'ADNc (10 pi) est incube 2 min a 100°C, conserve dans la glace, 
puis sont ajoutes : H 2 0 (2,5 pi), tampon TdT 5X (4 pi, AMERSHAM), dATP 5mM 
(2 ul) et TdT (1,5 pi, AMERSHAM). Le melange ainsi obtenu est incube 45 min a 
37°C puis 2 min a 65°C. 

25 Le produit obtenu est amplifie par une premiere reaction PCR h l'aide 

des amorces: S/L/-/225-206 et ancre 14T : 5'- 

AGATGAATTCGGTACCTTTTTTTTTTTTTT-3 ' (SEQ ID NO :68). Les conditions 
de l'amplification sont les suivantes : une etape initiale de denaturation a 94°C 
pendant 2 min est suivie de 10 cycles comprenant une etape de denaturation h 94°C 

30 pendant 10 sec, une etape d 'hybridation a 45°C pendant 30 sec puis une etape 
d'elongation h 72°C pendant 30 sec puis de 30 cycles comprenant une etape de dena- 
turation a 94°C pendant 10 sec, une etape d'hybridation h 50°C pendant 30 sec puis 
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une 6tape d'elongation a 72°C pendant 30 sec, puis d'une etape finale d' elongation a 

72°C pendant 5 min. 

Le produit de la premiere amplification PCR a subi une seconde 
etape d' amplification a l'aide des amorces : S/L/-/204-185 et ancre 14T pr6citee dans 
5 des conditions identiques a celles de la premiere amplification. L'amplicon ainsi 
obtenu a ete purifie, sequence a l'aide de 1'amorce S/L/-/182-163 puis il a ete clone 
comme ci-dessus pour les differentes ORF, pour donner le plasmide denomme SARS- 
5'NC. L'ADN de ce clone a ete isole et sequenc6 a l'aide des amorces universelles 
M13 sens et M13 anti-sens et de 1'amorce S/L/-/1 82-163 pr6citee. 
10 L'amplicon representant l'ADNc correspondant a l'extremite 5'NC 

de la souche de SARS-CoV issue du prelevement repertorie sous le n° 031589 
correspond a la sequence SEQ ID NO : 72 dans la liste de sequences jointe en annexe ; 
cette sequence ne comporte pas de differences par rapport aux sequences 
correspondantes des isolats AY2741 19.3-Tor2 et AY278741-Urbani. 
15 Le plasmide denomme SARS-5'NC a ete depose sous le n° I- 3 124, 

le 7 novembre 2003, aupres de la Collection Nationale de Cultures de 
Microorganismes, 25 rue du Docteur Roux, 75724 Paris Cedex 15 ; il contient 
l'ADNc correspondant a l'extremite 5'non codante du genome de la souche de SARS- 
CoV issue du prelevement repertorie sous le n° 031589, telle que definie ci-dessus, 
20 laquelle sequence correspondant aux nucleotides des positions 1 a 204 (SEQ ID 
NO :39 ), en reference a la sequence Genbank n° d'acces AY2741 19.3. 
b) extremite 3'non-codante (3'NC) 
ai) synthese del! ADNc 

Les ARN issus du prelevement 031589, extraits comme ci-dessus, 
25 ont ete soumis a une transcription inverse, selon le protocole suivant : le melange 
reactionnel contenant : ARN (5 pi), H 2 0 (5 pi), tampon de transcriptase inverse 5X (4 
pi), dNTP 5 mM (2 pi), Oligo 20T 5pM (2 pi), RNasin 40 U/ pi (0,5 pi) et RT-AMV 
10 UI/ pi (1,5 pl, PROMEGA) a ete incub6 dans un thermocycleur, dans les conditi- 
ons suivantes : 45 min a 42°C, 15 min a 55°C, 5 min a 95°C, puis il a et6 maintenu a 
30 +4°C. 

L'ADNc obtenu a ete amplify par une premiere reaction PCR a 
l'aide des amorces S/N/+/28468-28487 et ancre 14T precitee. Les conditions de 
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l'amplification sont les suivantes : une etape initiale de denaturation a 94°C pendant 2 
min est suivie de 10 cycles comprenant une etape de denaturation a 94°C pendant 20 
sec, une etape d'hybridation a 45°C pendant 30 sec puis une etape d'elongation a 
72°C pendant 50 sec puis de 30 cycles comprenant une etape de denaturation a 94°C 
5 pendant 20 sec, une etape d'hybridation a 50°C pendant 30 sec puis une etape 
d'elongation a 72°C pendant 50 sec, puis d'une etape finale d'elongation a 72°C 
pendant 5 min. 

Le produit de la premiere amplification PCR a subi une seconde 
etape d'amplification a l'aide des amorces S/N/+/28933-28952 et ancre 14Tprecitee, 
10 dans des conditions identiques a celles de la premiere amplification. L'amplicon ainsi 
obtenu a ete purifie, sequence a l'aide de l'amorce S/N/+/2925 7-29278 et clone 
comme ci-dessus pour les differentes ORF, pour donner le plasmide denomme S ARS- 
3'NC. L'ADN de ce clone a ete isole et sequence a l'aide des amorces universelles 
Ml 3 sens et M13 anti-sens et de l'amorce S/N/+/29257-29278 precitee. 
15 L'amplicon representant l'ADNc correspondant a l'extremite 3'NC 

de la souche de SARS-CoV issue du prelevement repertorie sous le n° 031589 corres- 
pond a la sequence SEQ ID NO :73 dans la liste de sequences jointe en annexe ; cette 
sequence ne comporte pas de differences par rapport aux sequences correspondantes 
des isolats AY2741 19.3-Tor2 et AY278741-Urbani. 
20 Le plasmide denomme S ARS-3 'NC a ete depose sous le n° 1-3 1 23 le 

7 novembre 2003, auprds de la Collection Nationale de Cultures de Microorganismes, 
25 rue du Docteur Roux, 75724 Paris Cedex 15. ; il contient la s6quence d'ADNc 
correspondant a l'extremite 3'non codante du genome de la souche de SARS-CoV 
issue du prelevement repertori6 sous le n° 031589, telle que definie ci-dessus, laquelle 
25 sequence correspondant a celle situee entre le nucleotide en position 28933 a 29727 
(SEQ ID NO :40), en reference a la sequence Genbank n° d'acces AY274119.3, se 
termine par une serie de nucleotides a. 
2.6) ORFlaetORFlb 

L'amplification de la region 5' contenant les ORFla et ORFlb du 
30 genome du SARS-CoV issu du prelevement 031589 a ete realisee en pratiquant des 
reactions de RT-PCR suivies de PCR nichees selon les memes principes que ceux 
precedemment decrits pour les autres ORF. Les fragments amplifies sont chevau- 
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chants sur plusieurs dizaines de bases, pennettant ainsi la reconstruction informatique 
de la sequence complete de cette partie du genome. En moyenne, les fragments ampli- 
fies sont de deux kilobases. 

14 fragments chevauchants denommes LO a LI 2 ont ainsi 6t6 

amplifies a l'aide des amorces suivantes : 

Tableau II ; Amorces utilisees pour 1'amplification 



REGION 
AMPLIFIEE 
ET 

SEQUENCEE 
(ne tient pas 
compte des 
amorces) 


Amorce sens 
RT-PCR 


Amorce antisens 
RT-PCR 


Amorce sens 


Amorce 
antisens PCR 
nichee 


LO 
50-480 


S/LO/F1/+30 


S/L0/R1/-481 






L1 

231-2240 


S/L1/F1/+147 


S/L1/R1/-2336 


S/L1/F2/+211 


S/L1/R2/-2241 


L2 

J. 1 OO-^H Of 


S/L2/F1/+2033 


S/L2/R1/-4192 


S/L2/F2/+2136 


S/L2/R2/-4168 


L3 

3913-5324 


S/L3bis/F1/+3850 


S/L3bis/R1/-5365 


S/L3bis/F2/+3892 


S/L3bis/R2/-5325 


L4b 
4952-6023 


S/L4b/F1/+4878 


S/L4b/R1/-6061 


S/L4b/F2/+4932 


S/L4b/R2/-6024 


L4 

5325-7318 


S/L4/F1/+5272 


S/L4/R1/-7392 


S/L4/F2/+5305 . 


S/L4/R2/-7323 


L5 

7296-9156 


S/L5/F1/+7111 


S/L5/R1/-9253 


S/L5/F2/+7275 


S/L5/R2/-9157 


L6 

9053-11066 


S/L6/F1/+8975 


S/L6/R1/-11151 


S/L6/F2/+9032 


S/L6/R2/-11067 


L7 

10928-12962 


S/L7/F1/+10883 


S/L7/R1/-13050 


S/L7/F2/+10928 


S/L7/R2/-12963 


L8 

12835-14834 


S/L8/F1/+12690 


S/L8/R1/-14857 


S/L8/F2/+12815 


S/L8/R2/-14835 


L9 

14765-16624 


S/L9/F1/+14688 


S/L9/R1/-16678 


S/L9/F2/+14745 


S/L9/R2M6625 


L10 
16534-18570 


S/L10/F1/+16451 


S/L10/R1M8594 


S/L10/F2/+16514 


S/L10/R2/-18571 


L11 

18521-20582 


S/L11/F1/+18441 


S/L11/R1/-20612 


S/L11/F2/-M8500 


S/L11/R2/-20583 


L12 

20338-22205. 


S/L12/F1/+20279 


S/L12/R1/-22229 


S/L12/F2/+20319 


S/L12/R2/-22206 



excepte le fragment L0 qui a et6 amplifie comme decrit ci-dessus pour I'ORF-M : 
0 - RT-PCR : 30 min a 42°C, 15 min a 55°C, 2 min a 94°C, puis 

l'ADNc obtenu est amplifie dans les conditions suivantes : 40 cycles comprenant : une 
etape de denaturation a 94°C pendant 15 sec, une etape d'hybridation a 58°C pendant 
30 sec puis une etape d'elongation a 68°C pendant 1 min 30 sec, avec 5 sec 
d'elongation supplemental a chaque cycle, puis une etape finale d'elongation a 68°C 
[5 pendant 7 min. 
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- PCR nichee : une etape initiate de denaturation a 94°C pendant 2 
min est suivie de 35 cycles comprenant : une etape de denaturation a 94°C pendant 15 
sec, une 6tape d'hybridation a 60°C pendant 30 sec puis une etape d'elongation a 
72°C pendant 1 min 30 sec, avec 5 sec d'elongation supplemental a chaque cycle, 
puis une etape finale d'elongation a 72°C pendant 7 min. 

Les produits d'amplifications ont ete sequences a l'aide des amorces 
d6finies dans le Tableau III ci-apr6s : 

Tableau III : Amorces utib'sees pour le sequencage 
de la region 5' (ORFla et ORFlb) 



Noms 



S/L3/+/4932 
S/L4/+/6401 
S/L4/+/6964 
S/L4/-/6817 
S/L5/-/7633 
S/L5/-/8127 
S/L5/-/8633 
S/L5/+/7839 
S/L5/+/8785 
S/L5/+/8255 
S/L6/-/9422 
S/L6/-/9966 
S/L6/-/10542 
S/L6/+/10677 
S/L6/+/10106 
S/L6/+/9571 
S/L7/-/11271 
S/L7/-/11801 
S/L7/-/12383 
S/L7/+/12640 
S/L7/+/12088 
S/L7/+/11551 
S/L8/-13160 
S/L8/-/13704 
S/L8/-14284 
S/L8/+/14453 
S/L8/+/13968 
S/L8/+/13401 
S/L9/-15098 
S/L9/-15677 
S/L9/-16247 
S/L9/+16323 
S/L9/+15858 
S/L9/+15288 
S/L10/-16914 
S/L10/-17466 
S/L10/-18022 
S/L10/+18245 
S/L10/+17663 



Sequences (SEQ ID NO : 76 a 139) 



5'-CCACACACAGCTTGTGGATA-3' 
5'-CCGAAGTTGTAGGCAATGTC-3' 
5'-TTTGGTGCTCCTTCTTATTG-3' 
5'-CCGGCATCCAAACATAATTT-3' 
5'-TGGTCAGTAGGGTTGATTGG-3' 
5'-CATCCTTTGTGTCAACATCG-3' 
5-GTCACGAGTGACACCATCCT-3' 
5'-ATGCGACGAGTCTGCTTCTA-3' 
5'-TTCATAGTGCCTGGCTTACC-3' 
5'-ATCTTGGCGCATGTATTGAC-3' 
5'-TGCATTAGCAGCAACAACAT-3' 
5'-TCTGCAGAACAGCAGAAGTG-3* 
5'-CCTGTGCAGTTTGTCTGTCA-3' 
5'-CCTTGTGGCAATGAAGTACA-3' 
5'-ATGTCATTTGCACAGCAGAA-3' 
5'-CTTCAATGGTTTG CCATGTT-3' 
5-TGCGAGCTGTCATGAGAATA-3' 
5'-AACCGAGAGCAGTACCACAG-3' 
5'-TTTGGCTGCTGTAGTCAATG-3' 
5'-CTACGACAGATGTCCTGTGC-3' 
5--GAGCAGGCTGTAGCTAATGG-3' 
5'-TTAGGCTATTGTTGCTGCTG-3' 
5'-CAGACAACATGAAGCACCAC-3' 
5'-CGCTGACGTGATATATGTGG-3' 
5'-TGCACAATGAAGGATACACC-3' 
5'-ACATAGCTCGCGTCTCAGTT-3' 
5'-GGCATTGTAGGCGTACTGAC-3' 
5-GTTTGCGGTGTAAGTG CAG-3' 
5'-TAGTGGCGGCTATTGACTTC-3' 
5'-CTAAACCTTGAGCCGCATAG-3' 
5'-CATGGTCATAGCAGCACTTG-3' 
5'-CCAGGTTGTGATGTCACTGAT-3' 
5'-CCTTACCCAGATCCATCAAG-3' 
5'-CGCAAACATAACACTTGCTG-3' 
5'-AGTGTTGGGTACAAGCCAGT-3' 
5'-GTTCCAAGGAACATGTCTGG-3' 
5-AGGTGCCTGTGTAGGATGAA-3' 
5'-GGGCTGTCATGCAACTAGAG-3' 
5'-TCTTACACGCAATCCTGCTT-3' 
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S/L10/+17061 
S/L11/-/18877 
S/L11M9396 
S/L11/-20002 
S/L11/+20245 
S/L11/+/19611 
S/L1 1/+/19021 
SARS/L1/F3/+800 
SARS/L1/F4/+1391 
SARS/L1/F5/+1925 
SARS/L1/R3/-1674 
SARS/L1/R4/-1107 
SARS/L1/R5/-520 
SARS/L2/F3/+2664 
SARS/L2/F4/+3232 
SARS/L2/F5/+3746 
SARS/L2/R3/-3579 
SARS/L2/R4/-2991 
SARS/L2/R5/-2529 
SARS/L3/F3/+4708 
SARS/L3/F4/+5305 
SARS/L3/F5/+5822 
SARS/L3/R3/-5610 
SARS/L3/R4/-4988 
SARS/L3/R5/-4437 



5'-TACCCATCTGCTCGCATAG T-3' 

5'-GCAAGCAGAATTAACCCTCA-3' 

5'-AGCACCACCTAAATTGCATC-3' 

5'-TGGTCCCTTTGAAGGTGTTA-3' 

5'-TCGAACACATCGTTTATGGA-3' 

5'-GAAGCACCTGTTTCCATCAT-3' 

5-ACGATGCTCAGCCATGTAGT-3' 

5'-GAGGTGCAGTCACTCGCTAT-3' 

5'-CAGAGATTGGACCTGAGCAT-3' 

5'-CAGCAAACCACTCAATTCCT-3' 

5'-AAATGATGGCAACCTCTTCA-3' 

5'-CACGTGGTTGAATGACTTTG-3' 

5--ATTTCTGCAACCAGCTCAAC-3' 

5'-CGCATTGTCTCCTGGTTTAC-3' 

5'-GAGATTGAGCCAGAACCAGA-3' 

5'-ATGAGCAGGTTGTCATGGAT-3" 

5'-CTGCCTTAAGAAGCTGGATG-3' 

5'-TTTCTTCACCAGCATCATCA-3' 

5'-CACCGTTCTTGAGAACAACC-3' 

5'-TCTTTGGCTGGCTCTTACAG-3' 

5'-GCTGGTGATGCTGCTAACTT-3' 

5'-CCATCAAGCCTGTGTCGTAT-3' 

5-CAGGTGGTGCAGACATCATA-3' 

5'-AACATCAGCACCATCCAAGT-3' 

5-ATCGGACACCATAGTCAACG-3' 



Les sequences des fragments LO a L12 de la souche de SARS-CoV 
issue du prelevement repertori6 sous le n° 031589, correspondent respectivement aux 
sequences SEQ ID NO :41 a SEQ ID NO :54 dans la liste de sequences jointe en 
annexe. Parmi ces sequences, seule celle correspondant aux fragments L5 comporte 
une difference nuc!6otidique par rapport a la sequence correspondante de l'isolat 
AY278741-Urbani. Cette mutation t/c en position 7919 aboutit a une modification de 
la sequence en acides amines de la proteine correspondante, codee par l'ORP la: en 
position 2552, une valine (codon gtt ; AY278741) est changee en alanine (codon get) 
dans la souche de SARS-CoV 031589. En revanche, aucune mutation n'a et6 identifiee 
par rapport a la sequence correspondante de l'isolat AY2741 19.3-Urbani. Les autres 
fragments ne presentent pas de differences par rapport aux sequences correspondantes 
des isolats Tor2 et Urbani. 
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Exemple 2 : Production et purification de protein es N et S recombinantes de la 
souche de SARS-CoV issue du prelevement repertorie sous le numero 031589 

La proteine entiere et deux fragments polypeptidiques de la proteine 
S de la souche de SARS-CoV issue du prelevement repertorie sous le numero 031589 
5 ont et£ produites chez E. coli, sous forme de proteines de fusion comprenant une 
etiquette polyhistidine N-ou C-terminale. Dans les deux polypeptides S, les s6quences 
hydrophobes N et C-terminales de la proteine S (peptide signal : positions 1 a 13 et 
helice transmembranaire : positions 1196 a 1218) ont ete deletees alors que Thelice P 
(positions 565 a 687) et les deux motifs de type coiled-coils (positions 895 a 980 et 

10 1 155 a 1 186) de la proteine S ont ete preserves. Ces deux polypeptides sont constitues 
par : un fragment long (Sl) correspondant aux positions 14 a 1 193 de la sequence en 
acides amines de la proteine S et un fragment court (Sc) correspondant aux positions 
475 a 1 1 93 de la sequence en acides amines de la proteine S. 
1) Clonage des ADNc N, S L et S c dans les vecteurs d'expression pIVEX2 3 et 

15 pIVEX2.4 

Les ADNc correspondant a la proteine N et aux fragments Sl et Sc 
ont et6 amplifies par PCR dans des conditions standard, a Faide de 1'ADN polymerase 
Platinium Pfic® (INVITROGEN). Les plasmides SRAS-N et SRAS-S ont ete utilises 
comme matrice et les oligonucleotides suivants comme amorces : 

20 5 ' -CCCATATGTCTG ATAATGGACCCCAATC AAAC-3 5 (N sens, SEQ ID NO :55) 

5 ' -CCCCCGGGTGCCTGAGTTGAATCAGCAGAAGC-3 9 (N antisens 5 SEQ ID NO :56) 
5 '-CCCAXATG AGTGACCTTGACCGGTGCACCAC-3 * (S c sens, SEQ ID NO :57) 
S^CCCATATGAAACCTTGCACCCCACCTGCTC-S' (S L sens 5 SEQ ID NO :58) 
5 ' -CCCCCGGGTTTAAT ATATTGCTC ATATTTTCCC-3 ' (S c et S L antisens, SEQ ID 

25 NO :59). 

Les amorces sens introduisent un site Ndel (souligne) alors que les 
amorces antisens introduisent un site Xmal ou Smal (souligne). Les 3 produits 
d'amplification on 6te purifies sur colonne (kit QIAquick PCR Purification, QIAGEN) 
et clones dans un vecteur approprie. L*ADN plasmidique purifie des 3 constructions 
30 (kit QIAFilter Midi Plasmid, QIAGEN) a et6 verifie par sequen?age et digere par les 
enzymes Ndel et Xmal. Les 3 fragments correspondants aux ADNc N, Sl et S c ont 6te 
purifies sur gel d'agarose puis inseres dans les plasmides pIVEX2.3MCS (etiquette 
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polyhistidine C-terminale) et pIVEX2.4d (Etiquette polyhistidine N-terminale) preala- 
blement diger6s par !es memes enzymes. Apres verification des constructions, les 6 
vecteurs ^expressions ainsi obtenus (pTV2.3N, P IV2.3S Q P IV2.3S L , pIV2.4N, 
pIV2.4S c egalement denomme P rV2.4S,, pIV2.4S L ) ont ete ensuite utilises, d'une part 
5 pour tester repression des proteines in-vitro, et d'autre part pour transformer la 
souche bacterienne BL21(DE3)pDlA17 (NOVAGEN). Ces constructions codent pour 
des proteines dont la masse moleculaire attendue est la suivante : pIV2.3N (47174 
Da), pIV2.3Sc (82897 Da), pIV2.3S L (132056 Da), pIV2.4N (48996 Da), PIV2.4S, 
(81076 Da) et pIV2.4S L (l 33877 Da). 
1 0 2) Analyse de l'expression des proteines recombinantes in-vitro et in vivo 

L'expression de proteines recombinantes a partir des 6 vecteurs 
recombinants a et6 testee, dans un premier temps, dans un systeme in-vitro (RTS100, 
Roche). Les proteines produites in vitro, apres une incubation des vecteurs recombi- 
nants pTVEX, 4h a 30°C, dans le systeme RTS100, ont ete analysees par western-blot 
15 a l'aide d'un anticorps anti-(his) 6 couple a la peroxydase. Le resultat d'expression in- 
vitro (Figure 1) montre que seule la proteine N est exprimee en quantites importantes, 
cela quelle que soit la position, N- ou C-terminale, de 1'etiquette polyhistidine. Dans 
une seconde etape, l'expression des proteines N et S a ete testee in-vivo a 30°C dans 
du milieu LB, en presence ou en r absence d'inducteur (IPTG ImM). La proteine N 
20 est tres bien produite dans ce systeme bacterien (Figure 2) et se retrouve principale- 
ment dans une fraction soluble apres lyse des bacteries. En revanche, la version longue 
de S (SO est tres peu produite et complement insoluble (Figure 3). La version courte 
(S C ) presente 6galement une tres faible solubilite, mais un taux d'expression beaucoup 
plus elev6 que celui de la version longue. Par ailleurs, la construction S c fusionnee a 
25 une etiquette polyhistidine en position C-terminale presente une taille plus faible que 
celle attendue. Une experience d' immunodetection avec un anticorps anti-poly- 
histidine a montre que cette construction etait incomplete. En conclusion, les deux 
constructions, pIV2.3N et pIV2.4S,, exprimant respectivement la proteine N entiere 
fusionnee a 1'etiquette polyhistidine en C-terminal et la proteine S courte fusionnee a 
30 1'etiquette polyhistidine en N-terminal, ont et6 retenues pour produire les deux 
proteines en grande quantite afin de les purifier. 
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3) Analyse de I'activite antigenique des proteines recombinantes 

L'activite antigenique des prolines N, Sl et Sc a ete testee par 
western-blot, a l'aide de deux echantillons de serum, provenant d'un meme patient 
infecte par le SARS-CoV, preleves 8 jours (Ml 2) et 29 jours-(M13) apres le debut des 
5 symptdmes du SRAS. Le protocole experimental est comme decrit a l'exemple 3. Les 
resultats illustres par la figure 4 montrent (i) la seroconversion du patient, et (ii) que la 
proteine N possede une plus forte reactivite antigenique que la proteine S courte. 

4) Purification de la proteine N a partir de pIV2.3N 

Plusieurs experiences de purification de la proteine N, produite a 
10 partir du vecteur pIV2.3N, ont 6t6 r6alisees selon le protocole suivant. Les bacteries 
BL21(DE3)pDIA17, transformees par le vecteur d'expression pIV2.3N, ont ete culti- 
vees a 30°C dans 1 litre de milieu de culture contenant 0,1 mg/ml d'ampicilline, et 
induites par 1 mM IPTG quand la densite cellulaire, equivalente a A 600 = 0,8, est 
atteinte (environ 3 heures). Apres 2 heures de culture en presence d'inducteur, les 
1 5 cellules ont et6 recuperees par centrifugation (10 min a 5000 rpm), remises en suspen- 
sion dans le tampon de lyse (50 mM NaH 2 P0 4 , NaCl 0,3 M, 20 mM imidazole, pH 8 
contenant le melange d'inhibiteurs de proteases Complete® , Roche), et lysees par la 
presse de French (12000 psi). Apres centrifugation du lysat bacterien (15 min a 12000 
rpm), le surnageant (50 ml) a ete depose a un debit de lml/min sur une colonne (15 
20 ml) de chelation metallique (Ni-NTA superflow, Qiagen), equilibree par le tampon de 
lyse. Apres lavage de la colonne par 200 ml de tampon de lyse, la proteine N a ete 
eluee par un gradient d'imidazole (20 ->250 mM) en 10 volumes de colonne. Les 
fractions contenant la proteine N ont ete rassemblees et analysees par electrophorese 
en gel de polyacrylamide en conditions denaturantes puis coloration au bleu de 
25 Coomassie. Les resultats illustres par la figure 5 montrent que le protocole employe 
permet de purifier la proteine N avec une homogeneite tres satisfaisante (95%) et un 
rendement moyen de 1 5 mg de proteine par litre de culture. 
5) Purification de la proteine S c a partir de pIV2.4Sc(pIV2.4Si) 

Le protocole suivi pour purifier la proteine S courte est tres different 
30 de celui decrit ci-dessus car la proteine est fortement aggregee dans le systeme bacte- 
rien (corps d'inclusion). Les bacteries BL21(DE3)pDIA17, transformees par le 
vecteur d'expression pIV2.4S| ont et6 cultiv6es a 30°C dans 1 litre de milieu de 
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culture contenant 0,1 mg/ml d'ampicilline, et induites par 1 mM IPTG quand la 
densite cellulaire, Squivalente h A 6 oo = 0,8, est atteinte (environ 3 heures). Apres 2 
heures de culture en presence d'inducteur, les cellules ont ete r6cup6rees par centrifu- 
gation (10 min k 5000 rpm), remises en suspension dans le tampon de lyse (0,1 M 

5 Tris-HCl, EDTA 1 mM, pH 7,5), et lysees par la presse de French (1200 psi). Apres 
centrifagation du lysat bacterien (15 min a 12000 rpm), le culot a ete remis en suspen- 
sion dans 25 ml de tampon de lyse contenant 2% Triton XI 00 et 10 mM p- 
mercaptoethanol, puis centrifuge pendant 20 min a 12000 rpm. Le culot a 6te remis en 
suspension dans un tampon Tris-HCl 10 mM contenant 7 M ur6e, et mis en agitation 

10 douce pendant 30 min a temperature ambiante. Ce dernier lavage des corps 
d'inclusion avec 7 M ur6e est necessaire pour eliminer la plupart des proteines 
membranaires d 'E. coll qui co-sedimentent avec la proteine Sc aggregee. Apres une 
derniere centrifugation pendant 20 min a 12000 rpm, le culot final est remis en 
suspension dans le tampon Tris-HCl 10 mM. L' analyse electrophoretique de cette 

15 preparation (Figure 6) montre que la prot&ne S courte peut etre purifiee avec une 

homogeneite satisfaisante (environ 90%) a partir des corps dMnclusion (extrait Hi- 
insoluble). '* 
Exemple 3 : Immunodominance de la proline N 

La reactivite des anticorps presents dans le serum des patients ^ 

20 atteints de pneumopathie atypique causee par le coronavirus associe au SRAS (SARS- 
CoY), vis-a-vis des differentes proteines de ce virus, a 6te analysee par westem-blot 
dans les conditions decrites ci-apres. 
1) Materiel 

a) lvsat de cellules infectees par le SARS-CoV 

25 Des cellules Vero E6 (2xl0 6 ) ont ete infectees par le SARS-CoV 

(isolat r6pertori<§ sous le numero FFM/MA104) a une multiplicite d'infection (M.O.I.) 
de 10" 1 ou 10" 2 puis incub6es dans du milieu DMEM contenant 2% de SVF, a 35°C 
dans une atmosphere contenant 5% de CO2. 48 heures plus tard, le tapis cellulaire a 
et6 lave avec du PBS puis lyse avec 500 \xl de tampon de depot prepare selon Laemmli 

30 et contenant du B-mercapto6thanol. Les echantillons ont ensuite et6 bouillis 10 
minutes puis soniques 3 fois 20 secondes. 
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b) anticorps 

Le serum reference au Centre National de Reference des virus 
influenzae (Region-Nord) sous le N° 20033168 est celui d'un patient firancais atteint 
d'urie pneumopathie atypique causee par le SARS-CoV preleve au jour 38 apres le 
debut des syraptomes ; le diagnostic d'infection par le SARS-CoV a ete realise par 
RT-PCR nichee et PCR quantitative. 
&2) - s -^l??s.po^clonaux.de._l_apm 
prpteine.S 

Les serums sont ceux produits a partir des proteines recombinantes N 
et S c (exemple 2), selon le protocole d'immunisation decrit a Fexemple 4 ; il s'agit du 
serum du lapin PI 3097 (s6rum anti-N) et du serum du lapin PI 1 135 (serum anti-S). 
2) Methode 

20 ul de lysat de cellules infectees par le SARS-CoV a des M.O.L de 
10" et 10" et, a titre de controle, 20 pi d'un lysat de cellules non" infectees (mock) ont 
ete separes sur un gel SDS a 10% de polyacryl amide puis transferes sur une 
membrane de nitrocellulose. Apres blocage dans une solution de PBS/lait 5%/Tween 
0,1% et lavage en PBS/Tween 0,1%, cette membrane a ete hybridee pendant une nuit 
a 4°C avec : (i) Timmun-sSrum N° 20033168 dilue au 1/300, 1/1000 et 1/3000 dans le 
tampon PBS/BSA 1%/Tween 0,1%, (ii) le serum du lapin PI 3097 (s€rum anti-N) 
dilue au 1/50000 dans le raeme tampon et (iii) le serum du lapin PI 1 1 35 (serum anti- 
S) dilue au 1/10000 dans le meme tampon. Apres lavage en PBS/Tween, une hybrida- 
tion secondaire a 6te realisee k Taide, soit d'anticorps polyclonaux de mouton dirig6s 
contre les chaines lourdes et legeres des immunoglobulines G humaines et couples a la 
peroxidase (NA933V, Amersham), soit d'anticorps polyclonaux d'ane diriges Contre 
les chames lourdes et legeres des immunoglobulines G de lapin et couples a la 
peroxidase (NA934V, Amersham). Les anticorps fix6s ont ete revel6s a l'aide du kit 
ECL+ (Amersham) et de films d'autoradiographie Hyperfilm MP (Amersham). Une 
6chelle de masse moleculaire (kDa) est port6e sur la figure. 
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3) Resultats 

La figure 7 montre que trois polypeptides de masse moleculaire appa- 
rente 35, 55 et 200 kDa sont d6tectes specifiquement dans les extraits de cellules 
infectees par le SARS-CoV. 
5 Afin d'identifier ces polypeptides, deux autres immunoempreintes 

(figure 8) ont ete realisees sur les memes echantillons et dans les memes conditions 
avec des anticorps polyclonaux de lapins specifique de la nucl6oproteine N (lapin 
P13097, figure 8A) et de la proteine de spicule S (lapin PI 1135, figure 8B) Cette 
experience montre que le polypeptide de 200 kDa correspond a la glycoprotein de 

1 0 spicule S du SARS-CoV, que le polypeptide de 55 kDa correspond a la nucleoproteine 
N tandis que le polypeptide de 35 kDa represente vraisemblablement une forme 
tronquee ou d6gradee de la N. 

Les donnSes presentees dans la figure 7 montrent done que le s6rum 
20033168 reagit fortement avec la N et beaucoup plus faiblement avec la S du SARS- 

15 CoV, puisque les polypeptides de 35 et 55 kDa sont reveles sous la forme de bandes 
intenses pour des dilutions de 1/300, 1/1000 et 1/3000 de rimmunserum alors que le 
polypeptide de 200 kDa n'est que faiblement revele pour une dilution de 1/300. On 
peut noter egalement qu'aucun autre polypeptide du SARS-CoV n'est d6tecte pour des 
dilutions superieures au 1/300 du serum 20033168. 

20 Cette experience indique que la reponse en anticorps specifique de 

la N du SARS-CoV domine les r6ponses en anticorps specifiques des autres poly- 
peptides du SARS-CoV et en particulier la reponse en anticorps dirig<§e contre la 
glycoproteine S. Elle indique une immunodominance de la nucleoproteine N lors des 
infections humaines par le SARS-CoV. 

25 Exemple 4 : Preparation d'anticorps polyclonaux monospecifiques diriges contre 
les proteines N et S du coronavirus associe au SRAS (SARS-CoV) 
1) Materiel et methode 

Trois lapins (P13097, P13081, P13031) ont ete immunises avec le 
polypeptide recombinant purifie correspondant a Tintegralite de la nucleoproteine (N), 

30 prepare selon le protocole decrit a l'exemple 2. Apres une premiere injection de 0,35 
mg par lapin de proteine emulsionn6e en adjuvant complet de Freund (voie intra- 
dermique), les animaux ont re$us 3 injections de rappel a 3 puis 4 semaines 
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d'intervalle, de 0,35 mg de prot&ne recombinante 6mulsionnee en adjuvant incomplet 
deFreund. 

Trois lapins (PI 1135, P13042, P14001) ont ete immunises avec le 
polypeptide recombinant correspondant au fragment court de la proteine S (S c ), 
5 produit comme decrit a l'exemple 2. Comme ce polypeptide est retrouve principale- 
ment sous la forme de corps d'inclusion dans le cytoplasme bacterien, les animaux ont 
recus 4 injections intra-dermiques a 3-4 semaines d'intervalle d'une preparation de 
corps d'inclusion correspondant a 0,5 mg de proteine recombinante emulsionnee en 
adjuvant incomplet de Freund. Les 3 premieres injections ont ete realisees avec une 
10 preparation de corps d'inclusion prepares selon le protocole decrit a l'exemple 2, 
tandis que la quatrieme injection a ete realisee avec une preparation de corps 
d'inclusion qui ont ete prepares selon le protocole decrit a l'exemple 2 puis purifies 
sur gradient de saccharose et laves en 2 % Triton XI 00. 

Pour chaque lapin, un serum pre-immun (p.i.) a ete prepare avant la 
15 premiere immunisation et un immun-serum (I.S.) 5 semaines apres la quatrieme 
immunisation. 

Dans un premier temps, la reactivit6 des serums a ete analysee par 
test ELISA vis a vis de preparations de proteines recombinantes semblables a celles 
utilisees pour les immunisations ; les tests ELISA ont ete realises selon le protocole et 
20 avec les reactifs tels que decrits a l'exemple 6. 

Dans un deuxieme temps, la reactivity des serums a ete analysee en 
realisant une immunoempreinte (western blot) d'un Iysat de cellules infectees par le 
SARS-CoV, en suivant le protocole tel que decrit a l'exemple 3. 
2) Resultats 

25 Les tests ELISA (figure 9) demontrent que les preparations de 

proteine N recombinante et de corps d'inclusion du fragment court de la proteine S 
(S c ) sont immunogenes chez I'animal et que le titre des serums immuns est eleve (plus 
de 1/25000). 

L'immunoempreinte (figure 8) montre que le serum immun du lapin 
30 PI 3097 reconnait deux polypeptides presents dans les lysats de cellules infectees par 
le SARS-CoV : un polypeptide dont la masse moleculaire apparente (50-55 kDa selon 
les experiences) est compatible avec celle de la nucleoproteine N (422 residus, masse 
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moleculaire predite de 46 kDa) et un polypeptide de 35 kDa, qui repr6sente vraisem- 
blablement une forme tronquee ou d6gradee de la N. 

Cette experience montre egalement que le serum du lapin PI 1135 
reconnaTt principalement un polypeptide dont la masse moleculaire apparente (180- 
5 220 kDa selon les experiences) est compatible avec une forme glycosylee de la S 
(1255 residus, chaine polypeptidique non glycosylee de 139 kDa), ainsi que des poly- 
peptides plus legers, qui represented vraisemblablement des formes tronquees et/ou 

non glycosylees de la S. 

En conclusion, 1' ensemble de ces experiences demontrent que des 
10 polypeptides recombinants exprimes chez R coli et correspondant aux proteines N et 
S du SARS-CoV permettent d'induire chez 1'animal des anticorps polyclonaux 
capables de reconnaitre les formes natives de ces prot6ines. 

Exempje 5 : Preparation d'anticorps polyclonaux monospecifiques diriges contre 
les proteines M et E du coronavirus assocte au SRAS (S ARS-CoV) 
1 5 1) Analyse de la structure des proteines M et E 

al Proteine E 

La structure de la proteine E du SARS-CoV (76 acides amines) a ete -p 
analysee in silico , a l'aide de differents logiciels comme signalP vl .1 , NetNGIyc 1.0, .^i 
THMM 1.0 et 2.0 (Krogh et al., 2001, J. Mol. Biol., 305(3):567-580) ou encore .-^ 

20 TOPPRED (von Heijne, 1992, J. Mol. Biol. 225, 487-494). L'analyse montre que ce 
polypeptide non glycosyle est une proteine membranaire de type 1, contenant une 
seule helice transmembranaire (aa 12-34 d'apres THMM), et dont la plus grande partie 
du domaine hydrophile (42 residus) est localis6e a Pextremite C-terminale et vraisem- 
blablement a l'int6rieur de la particule virale (endodomaine). On peut noter une inver- 

25 sion dans la topologie predite par les versions 1 .0 (N-ter est externe) et 2.0 (N-ter est 
interne) du logiciel THMM, mais que d'autres algorithmes, notamment TOPPRED et 
THUMBUP (Zhou et Zhou, 2003, Protein Science 12 : 1547-1 555) confirment une 
localisation externe de l'extr&nite N-terminale de E. 
bl Proteine M 

30 Une analyse similaire realisee sur la proteine M du SARS-CoV (221 

acides amines) montre que ce polypeptide ne possede pas de peptide signal (d'apres le 
logiciel signalP vl.l) mais trois domaines transmembranaires (residus 15-37, 50-72, 
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77-99 d'apres THMM2.0) et un grand domaine hydrophile (aa 100-221) localise a 
l'interieur de la particule virale (endodomaine). Elle est vraisemblablement glycosylee 
sur I'asparagine en position 4 (d'apres NetNGlyc 1 .0). 

Ainsi, en accord avec les donnees experimentales connues pour les 
5 autres coronavirus, il est remarquable que les deux proteines M et E presentent des 
endodomaines correspondant a la majeure partie des polypeptides et des ectodomaines 
de tres petite taille. . . 

- I'ectodomaine de E correspond vraisemblablement aux residus 1 a 
11 ou 1 a 12 de la proteine : MYSFVSEETGT(L), SEQ ID NO : 70. En effet, la 

10 probabilit6 associee a la localisation transmembranaire du residu 12 est intermediate 
(0,56 d'apres THMM 2.0). 

- I'ectodomaine de M correspond vraisemblablement aux residus 2 a 
14 de la proteine : ADNGTTTVEELKQ, SEQ ID NO : 69. En effet, la methionine N- 
terminale de M est tres probablement clivee du polypeptide mature car le residu en 
position 2 est une Alanine (Varshavsky, 1996, 93:12142-12149). 

Par ailleurs, l'analyse de l'hydrophobicit6 (Kyte & Doolittle, Hopp 
& Woods) de la proteine E met en evidence que 1'extremite C-terminale de 
l'endodomaine de E est hydrophile et done vraisemblablement exposee a la surface de 
ce domaine. Ainsi, un peptide synthetiqne correspondant a cette extremite est un bon 
candidal immunogene pour induire chez I'animal des anticorps diriges centre 
l'endodomaine de E. En consequence, un peptide correspondant aux 24 residus C- 
terminaux de E a ete synthetase. 

2) Preparation d'anticorps diriges centre I'ectodomaine des proteines M et E et 
F endodomaine de la proteine E 

Les peptides M2-14 (ADNGTITVEELKQ, SEQ ID NO : 69), El- 
12 (MYSFVSEETGTL, SEQ ID NO: 70) et E53-76 (KPTVYVYSRV 
KNLNSSEGVP DLLV, SEQ ID NO : 71) ont et6 syn^tises par Neosystem. lis ont 
ete couples a la KLH (Keyhole Limpet Hemocyanin) a 1'aide du MBS (m-maleimido- 
benzoyl-N-hydroxysuccinimide ester) via une cysteine ajoutee au cours de la synthese 
soit en N-terminal du peptide (cas de E53-76) soit en C-terminal (cas de M2-14 et El 
12). 
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Deux lapins ont ete immunises avec chacun des conjugues, en 
suivant le protocole d'immunisation suivant : apres une premiere injection de 0,5 mg 
de peptide couple a la KLH et emulsionn6 en adjuvant complet de Freund (voie intra- 
dermique), les animaux re9oivent 2 a 4 injections de rappel a 3 ou 4 semaines 
5 d'intervalle de 0,25 mg de peptide couple a la KLH et emulsionne en adjuvant 

incomplet de Freund. 

Pour chaque lapin, un s6rum pre-immun (p.i.) a ete prepare avant la 
premiere immunisation et un immun-serum (I.S.) est pr6pare 3 a 5 semaines apres les 
injections de rappel. 

IQ La reactivite des serums est analyst dans un premier temps par test 

ELISA vis k vis du peptide utilise pour l'immunisation, puis par immunoempreinte 
vis-a-vis de lysats de cellules infectees par le SARS-CoV, comme decrit pour les 
serums anti-N et anti-S de l'exemple 4, selon des protocole similaires a ceux decrits 
aux exemples 3 et 6, respectivement pour 1' immunoempreinte et le test ELISA. 

15 Dans un second temps, la reactivite des immunserums diriges 

contre les peptides M2-14 et El -12 a reconnaitre les ectodomaines de M et de E 
presents a la surface de la particule virale native est analysee par des tests 
d'immunocapture et/ou d'immunopr6cipitation de virions natifs. 

Exemple 6 : Analyse de la reactivite en ELISA de la proteine N recombinante, 
20 vis-a-vis de serums de patients atteints de SRAS 
1) Materiel 

L'antigene utilise pour preparer les phases solides est la nucleo- 
proteine N recombinante purifiee preparee selon le protocole decrit a l'exemple 2. 

Les serums a tester (Tableau IV) ont et6 choisis sur la base des 
25 resultats d' analyse de leur reactivite par immunofluorescence (titre IF-SRAS), vis-a- 
vis de lysats de cellules infect6es par le SARS-CoV. 
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Tableau IV ; Serums testes en ELISA 



Reference 


N° serum 


Type 
de serum 


Date du 
Serum*** 


Titre IF-SRAS 


3050 


A 


T6moin 


na* 


nt** 


3048 


B 


Temoin 


na 


nt 


033168 


D 


Patient 1-SRAS 


27/04/03 (J38) 


320 


033397 


E 


Patient-1 SRAS 


11/05/03 (J52) 


320 


032632 


F 


Patient-2 SRAS 


21/03/03 (J17) 


2500 


032791 


G 


Patient-3 SRAS 


04/04/03 (J3) 


<40 


033258 


H 


Patient-3 SRAS 


28/04/03 (J27) 


160 



jours apres le debut des symptomes de SRAS. 



2)Methode 

La proteine N (100 u.1) diluee a differentes concentrations dans du 
tampon carbonate 0,1 M, pH 9,6 (1, 2 ou 4 jig/ml) est distribute dans les puits de 
plaques ELISA, puis les plaques sont incubees une nuit a temperature du laboratoire. 
Les plaques sont lavees avec du tampon PBS-Tween, saturees avec du tampon PBS- 
lait ecreme-saccharose (5 %). Les serums a tester (100 ul) prealablement dilues (1/50, 
1/100, 1/200, 1/400, 1/800, 1/1600 et 1/3200) sont ajoutes, puis les plaques sont incu- 
bees 1 h a 37° C. Apres 3 lavages, le conjugue anti-IgG humaines marque a la peroxy- 
dase (r6ference 209-035-098, JACKSON) dilue au 1/18000 est ajoute puis les plaques 
sont incubees lh a 37 °C. Apres 4 lavages, le chromogene (TMB) et le substrat (H 2 0 2 ) 
sont ajoutes et les plaques sont incubees 30min a temperature ambiante, a I'abri de la 
lumiere. La reaction est ensuite arretee puis 1'absorbance a 450 nm est mesuree a 
l'aide d'un lecteur automatique. 
3) Resultats 

Les tests ELISA (figure 10) demontrent que la preparation de 
proteine N recombinante est reconnue specifiquement par les anticorps de serums de 
patients atteints de SRAS preleves en phase tardive de 1 'infection (> 17 jours apres le 
debut des symptSmes) alors qu'elle n'est pas reconnue de facon significative par les 
anticorps d'un serum de patient preleve en phase precoce de l'infection (3 jours apres 
le debut des symptSmes) ni par des serums temoins de sujets non atteints de SRAS. 
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Exemple 7 : Detection du coronavirus associe au SRAS (SARS-CoV) par RT- 
PCR en temps reel a l'aide d'amorces specifiques du gene de la nucleoproteine 
1) Mise au point des conditions de la RT-PCR 

a) conception des amorces et des sondes 

La conception des amorces et sondes a ete realisee a partir de la 
sequence du genome de la souche de SARS-CoV issue du prelevement repertorie sous 
le mimero 031589, a l'aide du programme "Light Cycler Probe Design (Roche)". 
Ainsi les deux series d'amorces et de sondes suivantes ont et6 selectionnees : 

- seriel (SEQ ID NO : 60, 61, 64, 65): 

- amorce sens : N/+/28507 : 5'-GGC ATC GTATGG GTT G-3' [28507-28522] 

- amorce antisens : N/-/28774 : 5'-CAG TTT CAC CAC CTC C-3' [28774-28759] 

- sonde 1 : S^-GGC ACC CGC AAT CCT AAT AAC AAT GC-fluoresc6ine 3' [28561- 
28586] 

- sonde 2 : 5' Red705 -GCC ACC GTG CTA CAA CTT CCT-phosphate [28588-28608] 

- serie 2 (SEQ ID NO : 62, 63, 66, 67) 

- amorce sens : N/+/28375 : 5'-GGC TAC TAC CGA AGA G-3' [28375-28390] 

- amorce antisens : N/-/28702 : 5'-AAT TAC CGC GAC TAC G-3' [28702-28687] 

- sonde 1 : SRAS/N/FL : S'-ATA CAC CCA AAG ACC ACA TTG GC - fluorescein 3' 
[28541-28563] „ _ „ 

- sonde 2 : SRAS/N/LC705 : 5' Red705 -CCC GCA ATC CTA ATA ACA ATG CTG Cr 

phosphate 3' [28565-28589] 

b) analyse de l'efficacite des deux co uples amorces 

Afin de tester l'efficacite respective des deux couples d'amorces, une 
amplification par RT-PCR a &e realis6e sur un ARN synthetique correspondant aux 
nucleotides 28054-29430 du genome de la souche de SARS-CoV issue du preleve- 
ment repertorie sous le numero 031589et contenant la s6quence du gene N. 

De maniere plus precise : 

Cet ARN synthetique a ete prepare par transcription in vitro a l'aide 
de l'ARN polymerase du phage T7, d'une matrice d'ADN obtenu par linearisation du 
plasmide SRAS-N avec l'enzyme Bam HI. Apres elimination de la matrice d'ADN par 
digestion a l'aide de DNAse 1, les ARN synthetiques sont purifies par une extraction 
au phenol-chloroforme suivie de deux precipitations successives en acetate 
d'ammonium et isopropanol. Us sont alors quantifies par mesure de l'absorbance a 260 
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nm et leur qualite est controtee par le rapport des absorbances a 260 et 280 nm ainsi 
que par une electrophone en gel d'agarose. Ainsi, la concentration de la preparation 
d'ARN synthetique utilisee pour ces etudes est de 1,6 mg/ml, ce qui correspond a 
2,U0 15 copies/ml d'ARN. 

5 Des quantites decroissantes d'ARN synthetique ont ete amplifies par 

RT-PCR a l'aide du kit "Superscript™ One-Step RT-PCR with Platinum® Taq" et les 
couples d'amorces n° 1 (N/+/28507, NA/28774) (figure 1 A) et n° 2 (N/H-/28375, N/- 
/28702) (figure IB), en suivant les indications du fournisseur. Les conditions d'ampli- 
fication utilises sont les suivantes : l'ADNc a ete synthetise par incubation 30 min a 

10 45 °C, 15 min k 55°C puis 2 min a 94 °C puis il a ete amplifie par 5 cycles compre- 
nant : une etape de denaturation a 94°C pendant 15 sec, une 6tape d 'hybridation a 
45°C pendant 30 sec puis une etape d'elongation a 72°C pendant 30 sec, suivis de 35 
cycles comprenant: une etape de denaturation a 94°C pendant 15 sec, une etape 
d'hybridation a 55°C pendant 30 sec puis une etape d'elongation a 72°C pendant 30 

15 sec, avec 2 sec d' Elongation supplemental a chaque cycle, et d'une etape finale 
d'elongation a 72°C pendant 5 min. Les produits d'amplification obtenus ont ensuite 
ete maintenus a 10°C. 

Les resultats presentes a la figure 11 montrent que le couple 
d'amorces n° 2 (N/+/28375, NA/28702) permet de detecter jusqu'a 10 copies d'ARN 

20 (bande de faible intensite) ou 10 2 copies (bande de bonne intensite) contre 10 4 copies 
pour le couple d'amorces n° 1 (N/+/28507, NA/28774). Les amplicons sont respecti- 
vement de 268 pb (couple 1) et de 328 pb (couple 2). 

c) mise au point de la RT-PCR en temps reel 

Une RT-PCR en temps reel a 6t6 mise au point a l'aide du couple 
25 d ! amorces n°2 et du couple de sonde constitue par SRAS/N/FL et SRAS/N/LC705 
(figure 2). 

L ! amplification a ete rSalisee sur un LightCycler™ (Roche) a l'aide 
du kit "Light Cycler RNA Amplification Kit Hybridization Probes t! (reference 2 015 
145, Roche) dans les conditions optimises suivantes. Un M61ange reactionnel conte- 
30 nant : H 2 0 (6,8 ^il), MgCl 2 25 mM (0,8 jd, 4 jaM final de Mg2+), melange reactionnel 
5X (4 |il), sonde SRAS/N/FL 3*iM (0,5 \xl % 0,075 \xM final), sonde SRAS/N/LC705 3 
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pM (0,5 0,075 pM final), amorce N/+/28375 10 pM (1 ul, 0,5 pM final), amorce 
N/-/28702 10 pM (1 pi, 0,5 pM final), melange d'enzyme (0,4 pi) et echantillon 
(ARN viral, 5 pi) a ete amplifie en suivant le programme suivant : 

-Transcri ption inverse : 50°C 1 0:00min analysis mode: none 

5 - Penaturation : 95°C 30sec xl analysis mode: none 

- Am plification : 95°C 2sec ► 

50°C 15sec analysis mode: quantification *^ x45 

72°C 13sec rampe thermique 2,0°C/sec ► 

- Tefroidissement : 40°C 30sec xl analysis mode: none 

10 *La mesure de fluorescence se fait a la fin de l'hybridation et a chaque cycle (en mode 
SINGLE). 

Les resultats presentes a la figure 12 montrent que cette RT-PCR en 
temps reel est tres sensible puisqu'elle permet de detecter 10 2 copies d'ARN 
synthetique dans 100% des 5 echantillons analyses (29/29 echantillons dans 8 expe- 

15 riences) et jusqu'a 10 copies d'ARN dans 100% des 5 echantillons analyses (40/45 
echantillons dans 8 experiences). Elle montre egalement que cette RT-PCR permet de 
detecter la presence du genome du SARS-CoV dans un echantillon et de quantifier le 
nombre de genomes presents. A titre d'exemple, l'ARN viral d'un stock de SARS- 
CoV cultive sur cellules Vero E6 a ete extrait a l'aide du kit "Qiamp viral RNA 

20 extraction" (Qiagen), dilue a 0,05.1 0" 4 et analyse par RT-PCR en temps reel selon le 
protocole decrit ci-dessus; l'analyse presentee a la figure 12 montre que ce stock de 
virus contient 6,5. 10 9 genomes -equivalents/ml (geq/ml), ce qui est tout a fait 
similaire a la valeur de 1,0.10 10 geq/ml mesuree a l'aide du kit "RealArt™ HPA- 
Coronavirus LC RT PCR Reagents" commercialise par Artus. 

25 ttt detection de l'ARN du SARS-CoV p ar PCR en temps reel a partir de pr61evements 
respiratoires 

Une etude comparative a ete r6alisee sur une serie de prelevements 
respiratoires recus par le Centre National de Reference du Virus Influenzae (region 
nord) et susceptibles de contenir du SARS-CoV. Pour ce faire, l'ARN a ete extrait des 
30 prelevements a l'aide du kit "Qiamp viral RNA extraction" (Qiagen) et analyse par 
RT-PCR en temps reel, d'une part a l'aide des couples d'amorces et de sondes de la 
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serie n° 2 dans les conditions d&aites ci-dessus d'une part, et d'autre part a Taide du 
kit "LightCycIer SARS-CoV quantification kit" commercialise par Roche (r6ference 
03 604 438). Les resultats sont resumes dans le Tableau ci-dessous. lis montrent que 
18 des 26 prelevements sont n6gatifs et 5 des 26 pr&evements sont positifs pour les 
5 deux kits, tandis qu'un prelevement est positif pour le seul kit Roche et deux pour les 
seuls reactifs N"serie2". En outre, pour 3 pr61evements (20032701, 20032712, 
20032714) les quantites d'ARN d6tectes sont nettement superieures avec les reactifs 
(sondes et amorces) de la serie n°2. Ces resultats indiquent que les amorces et sondes 
N"s6rie2" sont plus sensibles pour la detection du genome du SARS-CoV dans des 
1 0 pr&dvements biologiques que celles du kit actuellement disponible. 

Tableau V; Analyse par RT-PCR en temps reel des ARN extraits d'une serie de 
prelevements de 5 patients h l'aide des couples d'amorces et de sondes de la serie 
n° 2 (N "serie 2") ou du kit "LightCycIer SARS-CoV quantification kit" (Roche). 
Le type de prelevement est indique ainsi que le nombre de copies de genome viral 
1 5 mesurees dans chacun des deux tests. NEG : RT-PCR negative. 



Prelevements n° 


Patient 


Type de prelevement 


KIT ROCHE 


N "sene2 w 


20033082 


K 


nasal 


NEG 


NEG 


20033083 


K 


pharynge 


NEG 


NEG 


20033086 


K 


nasal 


NEG 


NEG 


20033087 


K 


pharynge 


NEG 


NEG 


20032802 


M 


nasal 


NEG 


NEG 


20032803 


M 


expectoration 


NEG 


NEG 


20032806 


M 


nasal ou pharynge 


NEG 


NEG 


20031 746ARN2 


C 


pharynge 


NEG 


NEG 


20032711 


C 


nasal ou pharynge 


39 


NEG 


20032910 


B 


nasal 


NEG 


NEG 


20032911 


B 


pharynge 


NEG 


NEG 


20033356 


V 


expectoration 


NEG 


NEG 


20033357 


V 


expectoration 


NEG 


NEG 


20031725 


K 


asp. endotracheale 


NEG 


150 


20032657 


K 


asp. endotracheale 


NEG 


NEG 


20032698 


K 


asp. endotracheale 


NEG 


NEG 


20032720 


K 


asp. endotracheale 


3 


5 


20033074 


K 


selles 


115 


257 


20032701 


M 


pharynge 


443 


1676 


20032702 


M 


expectoration 


NEG 


249 


20031 747ARN2 


C 


pharynge 


NEG 


NEG 


20032712 


C 


inconnu 


634 


6914 


20032714 


c 


pharynge 


17 


223 


20032800 


B 


nasal 


NEG 


NEG 


20033353 


. V 


nasal 


NEG 


NEG 


20033384 


v 


nasal 


NEG 


NEG 
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REVINDICATIONS 

1°) Souche isolee ou purifiee de coronavirus humain associe an 
syndrome respiratoire aigu severe, caracterisee en ce que son genome presente sous la 
5 forme d' ADN compl&nentaire un codon serine en position 23220-23222 du gene de la 
proteine S ou un codon glycine en position 25298-25300 du gene de l'ORF3, et un 
codon alanine en position 7918-7920 de l'ORFla ou un codon serine en position 
26857-26859 du gene de la proteine M, lesdites positions etant indiquees en reference 
a la sequence Genbank AY2741 1 9.3. 
10 2°) Souche isolee ou purifiee de coronavirus selon la revendication 

1 ? caracterisee en ce que l'equivalent ADN de son genome presente une sequence 
correspondant a la sequence SEQ ID NO : 1 . 

3°) Polynucleotide isole ou purifie, caracterise en ce que sa sequence 
est celie du genome de la souche isolee de coronavirus selon la revendication 1 ou la 
1 5 revendication 2 . 

4°) Polynucleotide isole ou purifi6 selon la revendication 3, 
caracterise en ce que sa sequence est la SEQ ID NO : 1 . 

5°) Polynucleotide isole ou purifte, caracterise en ce que sa sequence 
hybride dans des conditions de forte stringence avec la sequence du polynucleotide 
20 selon la revendication 3 ou la revendication 4. 

6°) Fragment du polynucleotide selon Tune quelconque des revendi- 
cations 3 a 5, caracterise en ce qu'il est susceptible d'etre obtenu, soit par I'utilisation 
d'enzymes de restriction dont les dites de reconnaissance et de coupure sont presents 
dans ledit polynucleotide selon Tune quelconque des revendications 3 a 5, soit par 
25 amplification a Taide d'amorces oligonucleotidiques specifiques dudit polynucleotide 
selon Tune quelconque des revendications 3 a 5, soit par transcription in vitro, soit par 
synthese chimique. 

7°) Fragment du polynucleotide selon la revendication 6, caracteris6 
en ce qu'il est s&ectionne dans le groupe constitu6 par : PADNc correspondant a au 
30 moins un cadre ouvert de lecture (ORF) choisi parmi : ORFla, ORFlb, ORF-S, ORF- 
E, ORF-M, ORF-N, ORF3, ORF4, ORF7 h ORF11, ORF13 et ORF14, et l'ADNc 
correspondant aux extremites 5' ou 3 1 non-codantes dudit polynucleotide. 
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8°) Fragment selon la revendication 6, caracterise en ce qu'il 
presente une sequence selectionnSe dans le groupe constitu6 par : 

- les sequences SEQ ID NO : 2 et 4 repr6sentant l'ADNc corres- 
pondant a 1'ORF-S qui code pour la proteine S, 

5 - les sequences SEQ ID NO : 13 et 15 representant l'ADNc corres- 

pondant a l'ORF-E qui code pour la proteine E, 

- les sequences SEQ ID NO : 16 et 18 representant l'ADNc 
correspondant a l'ORF-M qui code pour la prot&ne M, 

- les sequences SEQ ID NO : 36 et 38 representant l'ADNc corres- 
1 0 pondant a FORF-N qui code pour la proteine N, 

- les sequences representant les ADNc correspondant respective- 
ment : aux ORF1 a et ORFlb (SEQ ID NO : 31), aux ORF3 et ORF4 (SEQ ID NO : 7, 
8), aux ORF 7 a 11 (SEQ ID NO : 19, 20), a FORF13 (SEQ ID NO : 32), et a 
l 5 ORF14(SEQIDNO:34), 

15 - les sequences representant les ADNc correspondant aux extremites 

5'(SEQ ID NO : 39, 72) et 3' non-codantes (SEQ ID NO : 40, 73) du polynucleotide 
selon la revendication 4. 

9°) Fragment selon la revendication 6, caracterise en ce qu'il 
presente une sequence s61ectionnee dans le groupe constitue par les sequences SEQ ID 

20 NO:5,6,et41 a 54. 

10°) Fragment selon la revendication 6, caracterise en ce qu'il 
presente au moins 15 bases ou paires de bases cons£cutives de la sequence dudit 
polynucleotide incluant au moins une de celles situees en position 7979, 16622, 
19064, 23220, 24872, 25298 et 26857. 

25 11°) Fragment selon la revendication 10, caracterise en ce qu'il 

inclut au moins un couple de bases ou de paires de bases correspondant aux positions 
suivantes : 7919 et 23220, 7919 et 25298, 16622 et 23220, 19064 et 23220, 16622 et 
25298, 19064 et 25298, 23220 et 24872, 23220 et 26857, 24872 et 25298, 25298 et 
26857. 

30 12°) Paire d'amorces apte a amplifier un fragment du genome d'un 

coronavirus associe au SRAS ou de son equivalent ADN, caracterisee en ce qu'elle est 
selectionn6 dans le groupe constitue par : 
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- la paire d'amorces n° 1 correspondant respectivement aux positions 
28507 a 28522 (amorce sens, SEQ ID NO : 60) et 28774 a 28759 (amorce anti-sens, 
SEQ ID NO : 61) de la sequence du polynucleotide selon la revendication 3 ou la 
revendication 4, et 

5 - la paire d'amorces n° 2 correspondant respectivement aux positions 

28375 a 28390 (amorce sens, SEQ ID NO : 62) et 28702 a 28687 (amorce anti-sens, 
SEQ ID NO : 63) de la sequence du polynucl6otide selon la revendication 3 ou la 
revendication 4. 

13°) Sonde apte a detecter la presence du genome d'un coronavirus 
10 associe au SRAS ou d'un fragment de celui-ci, caracterisee en ce qu'elle est selection- 
nee dans le groupe constitue par : les fragments selon Tune quelconque des revendi- 
cations 6 a 1 1 et les fragments correspondant aux positions suivantes de la sequence 
du polynucleotide selon la revendication 3 ou a la revendication 4: 28561 a 28586, 
28588 a 28608, 28541 a 28563 et 28565 k 28589 (SEQ ID NO : 64 a 67). 
15 14°) Puce ou filtre a ADN ou a ARN, caracterise en ce qu'il 

comprend au moins un polynucleotide ou Tun de ses fragments tels que definis a Tune jb; 
quelconque des revendications 3 a 11 - ■£ 
15°) Vecteur de clonage et/ou d' expression recombinant, caracterise . f 
en ce qu'il comprend un fragment selon Tune quelconque des revendications 6 a 1 1. 
20 16°) Vecteur recombinant selon la revendication 15, caracterise en 

ce qu'il comprend le fragment de sequence SEQ ID NO : 4 et qu'il est compris dans 
une souche bacterienne qui a et6 deposee sous le n° 1-3059, le 20 juin 2003, aupres de 
la Collection Nationale de Cultures de Microorganismes, 25 rue du Docteur Roux, 
75724 Paris Cedex 1 5. 

25 17°) Vecteur recombinant selon la revendication 15, caracterise en 

ce qu'il comprend le fragment de sequence SEQ ID NO :5 et qu'il est compris dans 
une souche bact6rienne qui a ete depos6e sous le sous le n° 1-3020, le 12 mai 2003, 
aupres de la Collection Nationale de Cultures de Microorganismes, 25 rue du Docteur 
Roux, 75724 Paris Cedex 15. 

30 18°) Vecteur recombinant selon la revendication 15, caract6rise en 

ce qu'il comprend le fragment de sequence SEQ ID NO :6 et qu'il est compris dans 
une souche bacterienne qui a ete d6posee sous le n° 1-3019, le 12 mai 2003, aupres de 
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la Collection Nationale de Cultures de Microorganismes, 25 rue du Docteur Roux, 
75724 Paris Cedex 15. 

19°) Vecteur recombinant selon la revendication 15, caracterise en 
ce qu'il comprend un fragment de sequence SEQ ID NO : 8 et qu'il est compris dans 
5 une souche bacterienne qui a ete deposee sous le n° le n° 1-3126, le, 13 novembre 
2003, aupres de la Collection Nationale de Cultures de Microorganismes, 25 rue du 
Docteur Roux, 75724 Paris Cedex 1 5. 

20°) Vecteur recombinant selon la revendication 15, caracterise en 
ce qu'il comprend le fragment de sequence SEQ ID NO : 15 et qu'il est compris dans 
10 une souche bacterienne qui a ete deposee sous le n° 1-3046, le 28 mai 2003, aupres de 
la Collection Nationale de Cultures de Microorganismes, 25 rue du Docteur Roux, 
75724 Paris Cedex 15. 

21°) Vecteur recombinant selon la revendication 15, caracterise en 
ce qu'il comprend un fragment de sequence SEQ ID NO :18 et qu'il est compris dans 
une souche bacterienne qui a ete deposee sous le n° 1-3047, le 28 mai 2003, aupres de 
la Collection Nationale de Cultures de Microorganismes, 25 rue du Docteur Roux, 
75724 Paris Cedex 15. 

22°) Vecteur recombinant selon la revendication 15, caracterise en 
ce qu'il comprend un fragment de sequence SEQ ID NO :20 et qu'il est compris dans 
une souche bacterienne qui a ete deposee sous.le n° 1-3125, le 13 novembre 2003, 
aupres de la Collection Nationale de Cultures de Microorganismes, 25 rue du Docteur 
Roux, 75724 Paris Cedex 15. 

23°) Vecteur recombinant selon la revendication 15, caracteris6 en 
ce qu'il comprend un insert de sequence SEQ ID NO :38 et qu'il est compris dans une 
souche bacterienne qui *£ deposee sous le n° 1-3048, le 5 juin 2003, aupres de la 
Collection Nationale de Cultures de Microorganismes, 25 rue du Docteur Roux, 
75724 Paris Cedex 15. 

24°) Vecteur recombinant selon la revendication 15, caracterise en 
ce qu'il comprend un fragment de sequence SEQ ID NO : 39 et qu'il est compris dans 
une souche bacterienne qui a ete deposee sous le n° I- 3124, le 7 novembre 2003, 
aupres de la Collection Nationale de Cultures de Microorganismes, 25 rue du Docteur 
Roux, 75724 Paris Cedex 15. 
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25°) Vecteur recombinant selon la revendication 15, caracterise en 
ce qu'il comprend un fragment de sequence SEQ ID NO : 40 et qu'il est compris dans 
une souche bacterienne qui a ete deposee sous le n° 1-3123 le 7 novembre 2003, 
aupres de la Collection Nationale de Cultures de Microorganismes, 25 rue du Docteur 

Roux, 75724 Paris Cedex 1 5. 

26°) Vecteur d'expression recombinant selon la revendication 15, 
caracterise en ce qu'il contient un fragment d'ADNc selectionne dans le groupe 
constitue par : 

- un fragment d'ADNc codant pour une fusion C-terminale de la 
proteine N (SEQ ID NO : 37) avec une etiquette polyhistidine, 

- un fragment d'ADNc codant pour une fusion C-terminale du 
fragment correspondant aux positions 475 a 1193 de la sequence en acides amines de 
la proteine S (SEQ 3D NO : 3) avec une etiquette polyhistidine, 

- un fragment d'ADNc codant pour une fusion C-terminale du 
fragment correspondant aux positions 14 a 1 193 de la sequence en acides amin6s de la 
proteine S (SEQ ID NO : 3) avec une etiquette polyhistidine, 

- un fragment d'ADNc codant pour une fusion N-terminale de la 
proteine N (SEQ ID NO : 3) avec une etiquette polyhistidine, 

- un fragment d'ADNc codant pour une fusion N-terminale du 
fragment correspondant aux positions 475 a 1193 de la sequence en acides amines de 
la proteine S (SEQ ID NO : 3) avec une 6tiquette polyhistidine, et 

- un fragment d'ADNc codant pour une fusion N-terminale du 
fragment correspondant aux positions 14 a 1 193 de la s6quence en acides amines de la 
proteine S (SEQ ID NO : 3) avec une etiquette polyhistidine. 

27°) Vecteur d'expression recombinant selon la revendication 26, 
caracterise en ce qu'il est compris dans une souche bacterienne qui a ete deposee sous 
le n° I- 3117, le 23 octobre 2003, aupres de la Collection Nationale de Cultures de 
Microorganismes, 25 rue du Docteur Roux, 75724 Paris Cedex 15. 

28°) Vecteur d'expression recombinant selon la revendication 26, 
caracterise en ce qu'il est compris dans une souche bacterienne qui a ete deposee sous 
le n° I- 3118, le 23 octobre 2003, aupres de la Collection Nationale de Cultures de 
Microorganismes, 25 rue du Docteur Roux, 75724 Paris Cedex 15. 
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25°) Vecteur recombinant selon la revendication 1 5, caracterise en 
ce qu'il comprend un fragment de sequence SEQ ID NO : 40 et qu'il est compris dans 
une souche bacterienne qui a ete deposee sous le n° 1-3123 le 7 novembre 2003, 
aupres de la Collection Nationale de Cultures de Microorganismes, 25 rue du Docteur 
5 Rqux, 75724 Paris Cedex 15. 

26°) Vecteur d'expression recombinant selon la revendication 15, 
caracterise en ce qu'il contient un fragment d'ADNc selectionne dans le groupe 
constitue par : 

- un fragment d'ADNc codant pour une fusion C-terminale de la 
1 0 proteine N (SEQ ID NO : 37) avec une etiquette polyhistidine, 

- un fragment d'ADNc codant pour une fusion C-terminale du 
fragment correspondant aux positions 475 a 1 193 de la sequence en acides amines de 
la proteine S (SEQ ID NO : 3) avec une etiquette polyhistidine, 

- un fragment d'ADNc codant pour une fusion C-terminale du 
fragment correspondant aux positions 14 a 1 193 de la sequence en acides amines de la 
proteine S (SEQ ID NO : 3) avec une etiquette polyhistidine, 

- un fragment d'ADNc codant pour une fusion N-terminale de la 
proteine N (SEQ ID NO : 37) avec une etiquette polyhistidine, 

- un fragment d'ADNc codant pour une fusion N-terminale du 
fragment correspondant aux positions 475 a 1 193 de la sequence en acides amines de 
la proteine S (SEQ ID NO : 3) avec une etiquette polyhistidine, et 

- un fragment d'ADNc codant pour une fusion N-terminale du 
fragment correspondant aux positions 14 a 11 93 de la sequence en acides amines de la 
protdine S (SEQ ID NO : 3) avec une etiquette polyhistidine. 

27°) Vecteur d'expression recombinant selon la revendication 26, 
caracterise en ce qu'il est compris dans une souche bacterienne qui a ete deposee sous 
le n° I- 3117, le 23 octobre 2003, aupres de la Collection Nationale de Cultures de 
Microorganismes, 25 rue du Docteur Roux, 75724 Paris Cedex 15. 

28°) Vecteur d'expression recombinant selon la revendication 26, 
caracterise en ce qu'il est compris dans une souche bacterienne qui a ete deposee sous' 
le n° I- 3118, le 23 octobre 2003, aupres de la Collection Nationale de Cultures de 
Microorganismes, 25 rue du Docteur Roux, 75724 Paris Cedex 15. 
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29°) Banque d'ADNc, caracterisee en ce qu'elle comprend des 
fragments selon Tune quelconque des revendications 6 4 11. 

30°) Cellules modifiees par un vecteur selon Tune quelconque des 
revendications 1 5 a 28 ou tine banque selon la revendication 29. 
5 31°) Proteine ou peptide isol6 ou purifie, caracterise en ce qu'il est 

code par le polynucleotide selon Tune quelconque des revendications 3 a 5 ou Tun de 
ses fragments selon Tune quelconque des revendications 6 a 1 1 . 

32°) Proteine isolee ou purifiee selon la revendication 31, caracteri- 
see en ce qu'elle est s61ectionnee dans le groupe constitue par : 
10 - la proteine S de sequence SEQ ID NO :3 , 

- la proteine E de sequence SEQ ED NO : 14, 

- la proteine M de sequence SEQ ID NO : 1 7, 

- la proteine N de sequence SEQ ID NO : 37, et 

- les proteines codees par les ORF : ORFla, ORFlb, ORF3, ORF4 et 
15 ORF7 a ORF11, ORF13 et ORF14 de sequence respectivement, SEQ ID NO :74, 75, 

1 0, 12, 22, 24, 26, 28, 30, 33 et 35 . 

.» 

33°) Peptide isole ou purifie selon la revendication 31, caracterise en * 
ce qu'il est selectionne dans le groupe constitue par : S 

a) les peptides correspondant aux positions 14 a 1 193 et 475 a 1 193 S*' 
20 de la sequence en acides amines de la prot6ine S, 

b) les peptides correspondant aux positions 2 a 14 (SEQ ID NO : 69) 
et 1 00 a 221 de la sequence en acides amines de la proteine M ; et 

c) les peptides correspondant aux positions 1 a 12 (SEQ ID NO : 70) 
et 53 a 76 (SEQ ID NO : 71) de la sequence en acides amines de la proline E ; et 

25 d) les peptides de 5 a 50 acides amines cons6cutifs, de preference de 

10 a 30 acides amines, inclus ou chevauchant partiellement ou total ement la sequence 
des peptides tels que d6finis en a), b) ou c). 

34°) Peptide selon la revendication 31, caracterise en ce qu'il 
presente une sequence de 7 a 50 incluant un residu d'acide amine selectionne dans le 

30 groupe constitue par : 
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29°) Banque d'ADNc, caracterisee en ce qu'elle comprend des 
fragments selon 1'une quelconque des revendications 6 a 1 1 , 

30°) Cellules modifiees par tin vecteur selon l'une quelconque des 
revendications 15 a 28 ou une banque selon la revendication 29. 
5 31°) Proteme ou peptide isote ou purifie, caracterise en ce qu'il est 

code par le polynucleotide selon l'une quelconque des revendications 3 a 5 ou l'un de 
ses fragments selon l'une quelconque des revendications 6 a 1 1. 

32°) Proteine isolee ou purifiee selon la revendication 31, caracteri- 
see en ce qu'elle est s61ectionnee dans le groupe constitue par : 
10 - la proteine S de sequence SEQ ID NO :3 , 

- la proteme E de sequence SEQ ID NO : 14, 

- la proline M de sequence SEQ ID NO : 1 7, 

- la proteine N de sequence SEQ ID NO : 37, et 

- les proteines codees par les ORE : ORFla, ORFlb, ORF3, ORF4 
15 et ORF7 a ORF11, ORF13 et ORE14 de s6quence respectivement, SEQ ID NO :74, 

75, 10, 12, 22, 24, 26, 28, 30, 33 et 35 . 

33°) Peptide isole ou purifie selon la revendication 31, caracterise en 
ce qu'il est selectionne" dans le groupe constitue^ par : 

a) les peptides correspondant aux positions 14 a 1 193 et 475 a 1193 
20 de la sequence en acides amines de la proline S, 

b) les peptides correspondant aux positions 2 a 14 (SEQ ID NO : 69) 
et 100 a 221 de la sequence en acides amines de la proteme M ; et 

c) les peptides correspondant aux positions 1 a 12 (SEQ ID NO : 70) 
et 53 a 76 (SEQ ID NO : 71) de la sequence en acides amines de la proteme E ; et 

25 d ) les peptides de 5 a 50 acides amines consecutifs, de preference de 

10 a 30 acides amines, inclus ou chevauchant partiellement ou totalement la sequence 
des peptides tels que definis en a), b) ou c). 

34°) Peptide selon la revendication 31, caracterise en ce qu'il est 
constitue de 7 a 50 acides amines consecutifs codes par un fragment tel que defini a la 
30 revendication 1 0, Jequel peptide est selectionne" dans le groupe constitue par : 

-un peptide comprenant 1 ' alanine situee en position 2252 de la 
sequence en acides amines de la proteine codde par l'ORFla, 
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- l'alanine situee en position 2252 de la sequence en acides amines 
de la proteine codee par l'ORFla de la souche isolee de coronavirus telle que definie a 
larevendication 1 ou a la revendication 2, 

- la serine situ6e en position 577 de la sequence en acides amines de 
5 la proteine S de la souche isolee de coronavirus telle que definie a la revendication 1 

ou a la revendication 2, 

- la glycine en position 11 de la sequence en acides amines de 
PORF3 de la souche isolee de coronavirus telle que definie a la revendication 1 ou a la 
revendication 2, et 

10 - la serine en position 154 de la sequence en acides amines de la 

prot&ne M de la souche isolee de coronavirus telle que definie a la revendication 1 ou 
a la revendication 2. 

35°) Anticorps ou fragment d' anticorps monoclonal ou polyclonal, 
susceptible d'etre obtenu par immunisation d'un animal avec un vecteur recombinant 

15 selon Tune quelconque des revendications 15 a 28, une banque selon la revendication 
29, ou bien une proteine ou tin peptide selon Tune quelconque des revendications 3 1 a 
34, caracterise en ce qu'il se lie avec Time au moins des proteines codees par le 
genome de la souche isolee ou purifie de coronavirus, telles que definies a la 
revendication 3 L 

20 36°) Puce ou filtre a proteine ou a peptide, caracterise en ce qu'il 

comprend une proteine ou un peptide selon Tune quelconque des revendications 31a 
34 ou bien un anticorps ou un fragment d'anticorps selon la revendication 35. 

37°) Reactif de d6tection d'un coronavirus associS au SRAS, 
caracterisS en ce qu'il est selectionne dans le groupe constitue par : 

25 (a) une paire d 'amorces selon la revendication 12, une sonde selon la 

revendication 13, ou une puce ou filtre a ADN ou a ARN selon la revendication 14, 

(b) un vecteur recombinant selon Tune quelconque des revendica- 
tions 15 a 26 ou une cellule modifiee selon la revendication 28, 

(c) une souche isolee de coronavirus selon la revendication 1 ou la 
30 revendication 2 ou un polynucleotide selon Tune quelconque des revendications 3 a 5, 

(d) une proteine ou un peptide selon Tune quelconque des revendi- 
cations 31 a 34, 
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- un peptide comprenant la serine situee en position 577 de la 
sequence en acides amines de la proteine S , 

- un peptide comprenant la glycine en position 1 1 de la sequence en 
acides amines de la proteine codee par PORF3, et 

5 - un peptide comprenant la serine en position 1 54 de la sequence en 

acides amines de la proteine M. 

35°) Anticorps ou fragment d'anticorps monoclonal ou polyclonal, 
susceptible d'etre obtenu par immunisation d'un animal avec un vecteur recombinant 
selon l'une quelconque des revendications 15 a 28, une banque selon la revendication 
1 0 29, ou bien une proteine ou un peptide selon l'une quelconque des revendications 3 1 a 
34, caracterise en ce qu'il se lie avec l'une au moins des proteines codees par le 
genome de la souche isolee ou purine de coronavirus, telles que definies a la 
revendication 3 1 . 

36°) Puce ou filtre a proteine ou a peptide, caracterise en ce qu'il 
1 5 comprend une proteine ou un peptide selon l'une quelconque des revendications 3 1 a 
34 ou bien un anticorps ou un fragment d'anticorps selon la revendication 35. 

37°) Reactif de detection d'un coronavirus associe au SRAS, 
caracterise en ce qu'il est selectionne dans le groupe constitud par : 

(a) une pake d 'amorces selon la revendication 12, une sonde selon la 
20 revendication 1 3, ou une puce ou filtre a ADNou a ARN selon la revendication 14, 

(b) un vecteur recombinant selon l'une quelconque des revendica- 
tions 15 a 28 ou une cellule modifiee selon la revendication 30, 

(c) une souche isolee de coronavirus selon la revendication 1 ou la 
revendication 2 ou un polynucleotide selon l'une quelconque des revendications 3 a 5, 

25 (d) me P«>t6ine ou un peptide selon l'une quelconque des revendi- 

cations 31 a 34, 

(e) un anticorps ou un fragment d'anticorps selon la revendication 

(f) une puce ou un filtre a proteine ou a peptide selon la revendica- 



35, et 
30 tion 36. 



38°) Utilisation d'un produit selectionne dans le groupe constitue 
par : une paire d'amorces selon la revendication 12, une sonde selon la revendication 
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(e) un anticorps cm un fragment d'anticorps selon la revendication 

35, et 

(f) une puce ou un filtre a proteine cm a peptide selon la revendica- 
tion 36. 

38°) Utilisation d'un produit selectionne dans le groupe constitue 
par : une paire d' amorces selon la revendication 12, une sonde selon la revendication 
13, une puce ou un filtre a ADN ou a ARN selon la revendication 14, un vecteur 
recombinant selon Tune quelconque des revendications 15 a 28, une cellule modiftee 
selon la revendication 30, une souche isolee de coronavirus selon la revendication 1 
ou la revendication 2, un polynucleotide selon Tune quelconque des revendications 3 a 
5, pour la preparation d'un reactif de detection et eventuellement de genotypage d'un 
coronavirus associe au SRAS. 

39°) Methode de detection d'un coronavirus associe au SRAS, a 
partir d'un echantillon biologique, laquelle m&hode est caracterisee en ce qu'elle 

comprend au moins : 

(a) l'extraction d'acides nucleiques presents dans ledit 6chantillon 

biologique, 

(b) r amplification d'un fragment de l'ORF-N par RT-PCR a l'aide 
d'un couple d' amorces selon la revendication 12, et 

(c) la detection par tout moyen approprie des produits 

d' amplifications obtenus en (b). 

40°) Methode selon la revendication 39, caracterise en ce que l'etape 
(b) de detection est realisee a l'aide d'au moins une sonde correspondant aux positions 
28561 a 28586, 28588 a 28608, 28541 a 28563 et 28565 a 28589 de la sequence du 
polynucleotide selon Tune quelconque des revendications 3 a 5. 

41°) Kit ou coffret de detection d'un coronavirus associe au SRAS, 
caracteris6 en ce qu'il comprend au moins un reactif selectionne dans le groupe 
constitu6 par: une paire d'amorces selon la revendication 12, une sonde selon la 
revendication 13, une puce ou un filtre a ADN ou a ARN selon la revendication 14, un 
vecteur recombinant selon Tune quelconque des revendications 15 a 28, une cellule 
modifiee selon la revendication 30, une souche isolee de coronavirus selon la 
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13, une puce ou un filtre a ADN ou k ARN selon la revendication 14, un vecteur 
recombinant selon l'une quelconque des revendications 15 a 28, une cellule modifiee 
selon la revendication 30, une souche isolee de coronavirus selon la revendication 1 
ou la revendication 2, un polynucleotide selon l'une quelconque des revendications 3 
a 5, pour la preparation d'un reactif de detection et eventuellement de genotypage 
d'un coronavirus associe au SRAS. 

39°) Methode de detection d'un coronavirus associe" au SRAS, a 
partir d'un echantillon biologique, laquelle methode est caracterisee en ce qu'elle 
comprend au moins : 

(a) l'extraction d'acides nucleiques presents dans ledit Echantillon 
biologique, 

(b) 1 'amplification d'un fragment de l'ORF-N par RT-PCR a 1'aide 
d'un couple d'amorces selon la revendication 12, et 

(c) la detection par tout moyen approprie des produits 
15 d 'amplifications obtenus en (b). 

40°) Methode selon la revendication 39, caracterise en ce que l'etape 
(c) de detection est realisee a l'aide d'au moins une sonde correspondant aux positions 
28561 a 28586, 28588 a 28608, 28541 a 28563 et 28565 a 28589 de la sequence du 
polynucleotide selon l'une quelconque des revendications 3 a 5. 

41°) Kit ou coffret de detection d'un coronavirus associe au SRAS, 
caraclerise en ce qu'il comprend au moins un reactif selections dans le groupe 
constitue par : une paire d'amorces selon la revendication 12, une sonde selon la 
revendication 1 3, une puce ou un filtre a ADN ou a ARN selon la revendication 14, un 
vecteur recombinant selon l'une quelconque des revendications 15 a 28, une cellule 
modifiee selon la revendication 30, une souche isolee de coronavirus selon la 
revendication 1 ou la revendication 2 et un polynucleotide selon l'une quelconque des 
revendications 3 a 5. 
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revendication 1 ou la revendication 2 et un polynucleotide selon l'une quelconque des 
revendications 3 a 5. 
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< TthHB8I 

< TaqI 

>< Sau3AI 
>< Ndell 



>< XhoII 
>< Sau3AI 
>< Ndell 
>< Mfll 
>< Mbol 
>< DpnII 



>< ScrFI 

>< Mval > 
>< EcoRII > 

>< Ecll36I 
>< DsaV 

>< BstOI 

>< BstNI 

>< BsiLI 
>< BsaJI 

>< Apyl 

ATATTAGGTT TTTACCTACC CAGGAAAAGC CAACCAACCT CGATCTCTTG TAGATCTGTT CTCTAAACGA 
10 20 30 40 50 60 70 



>< MboIX MnllX Dpnl 
>< DpnII >< BstYI 

>< Dpnl >< BspAI 
>< BspAI >< Bspl4 3I 

>< Bspl43lX Bglll 



>< Vnel 
>< SphI 

>< Snol 
>< Rmal 
>< Pael >< Sdul 
>< Nspl >< NspII 
>< NspHI >< HgiAI 
>< Nlalll >< Bspl286I 
>< Ma el X Bmyl 
X.Tru9I >< ApaLI 

>< Msel X Bbvl >< Alw4 4I 

>< Dral >< Alul > < Fnu4HI >< Alw21I 

ACTTTAAAAT CTGTGTAGCT GTCGCTCGGC TGCATGCCTA GTGCACCTAC GCAGTATAAA CAATAATAAA 
80 90 100 110 120 130 140 



v*: 



>< Sfcl 

>< PstI 
>< Mnll 
>< Ksp632I 

>< Hindll' > < MboII >< Earl 

x Hindi >< Maelll >< Eamll04I 

TTTTACTGTC GTTGACAAGA AACGAGTAAC TCGTCCCTCT TCTGCAGACT GCTTACGGTT TCGTCCGTGT 
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>< Mbol 
>< DpnII 

>< Dpnl 
>< BspAI 

>< Bspl43I 



>< Styl 
>< Rmal 
>< Mael 
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Avrll 



>< ScrFI 
>< Neil 
>< Mspl 

>< Maelll 
>< Hpall 
>< HapII 
>< DsaV 
>< Bcnl 

TGCAGTCGAT CAT CAGCAT A CCTAGGTTTC GTCCGGGTGT GACCGAAAGG TAAGATGGAG AGCCTTGTTC 
220 230 240 250 260 270 280 



>< 
>< 
>< 
>< 
>< 



>< Hindll 
>< Hindi 



>< MaeII> 
> < Afllll > 



< Eco57I 

< Ddel 



>< Esp3I 
>< BsrnAI 
>< Alw26I 



>< Rmal 
X Maell 

>< Mael 
X BsmBI 



TTGGTGTCAA CGAGAAAACA CACGTCCAAC TCAGTTTGCC TGTCCTTCAG GTTAGAGACG TGCTAGTGCG 
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>< Sau96I 
>< PssI 
>< Pall 
>< NspIV 
>< Mnll 
>< Haelll 
>< EcoO109I 

>< Dralix MboII >< Pmll 
>< Mnll >< Cfrl3I >< PmaCI 

>< Ksp632I >< BsuRI > < Maell 

>< Hinfl >< BsiZlX EcoNI X Eco72I 

>< Earl X BshI X BslI >< BsaAI 

>< Plel >< Eamll04IX Asul >< BsiYlx BbrPI >< Mnll 

TGGCTTCGGG GACTCTGTGG AAGAGGCCCT ATCGGAGGCA CGTGAACACC TCAAAAATGG CACTTGTGGT 
360 370 380 390 400 410 420 

X Tru9I 

>< RsaX >< SfaNI 

>< Rmal >< Csp6I >< BspWI X Msel 

>< Mael >< Alul >< Afal >< Alul > < Maell 

CTAGTAGAGC TGGAAAAAGG CGTACTGCCC CAGCTTGAAC AGCCCTATGT GTTCATTAAA CGTTCTGATG 
430 440 450 460 470 480 490 

>< Pall 

>< Haelll >< Rsal 

>< Tru9I >< Gdill Mcrl X 

>< Msel >< Eael >< Csp6I 

>< Esp4I >< BsuRI >< BsmI BsiEI >< 

>< Aflll >< BshI X Alul X BscCI X Afal 
CCTTAAGCAC CAATCACGGC CACAAGGTCG TTGAGCTGGT TGCAGAAATG GACGGCATTC AGTACGGTCG 

500 510 520 530 540 550 560 

>< Nspl 
x Seal X NspHI 

x Rsal x Nlalll 

> < Csp6I x BslI >< MboII 

X BsrI >< BsiYI X MboII 

>< Acil x Afal >< Afllll x Muni X Acil 

TAGCGGTATA ACACTGGGAG TACTCGTGCC ACATGTGGGC GAAACCCCAA TTGCATACCG CAATGTTCTT 
570 580 590 600 610 620 630 

X TthHB8I 
X TaqI 
X Sau3AI 
>< Ndell 
X Mbol 
>< DpnII 
> < Dpnl 
>< Clal 
>< Bsul5I 
X BspDI 

>< NlalV >< BspAI 

X Mspl > < Bspl4 3l 

X Hpall X Bspl06I 

X HapII x BsiXI Maelll > 

>< CfrlOI >< Bsclx SfaNI Ddel >< 

>< BscBI X Alul X Banlll Bfrl X 

CTTCGTAAGA ACGGTAATAA GGGAGCCGGT GGTCATAGCT ATGGCATCGA TCTAAAGTCT TATGACTTAG 
640 650 660 670 680 690 700 
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>< Sau3AI 
>< Ndell 
>< Mbol 

X HphI VneI 

>< DpnII Sno1 >K 

>< BspAI >< Nlalll 

>< AlwIX Dpnl >< Ddel ApaLI >< 

>< Alul >< Bspl43I >< MboII >< BsrI Alw44I >< 

GTGACGAGCT TGGCACTGAT CCCATTGAAG ATTATGAACA AAACTGGAAC ACTAAGCATG GCAGTGGTGC 
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720 



730 



740 



750 



760 



770 



>< Sdul 
X NspII 
><■ HgiAI 

>< Dralll 
>< Bspl286I 
>< Bmyl 
>< Alw21I 



>< SstI 
>< Sdul 
>< SacI 
>< NspII 

>< Mnll 
>< HgiAI 
X Eco2 4I 

>< Ecll36II 
>< Bspl286I 
>< Bmyl 
>< Banll 
>< Alw21I 

X Alul 



>< Maelll 



>< TthHB8I 
>< TaqI 

> < Sail 

> < Rtrl 

>< Hindll 
X Hindi 
>< Bsgl 
>< AccI 



ACTCCGTGAA CTCACTCGTG AGCTCAATGG AGGTGCAGTC ACTCGCTATG TCGACAACAA 
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Sau96I >< 
Pall >< 
NspIV >< 
Haelll >< 
Cfrl3I >< 
BsuRI >< 
BsiZI >< 
BshI >< 
Asul >< 
TTTCTGTGGC 
840 



> < Rsal 

> < NlalV 

>< Kpnl 
>< Eco64I 
>< Csp6I 

> < BscBI 
>< BanI 

>< Asp718 

> < Afal 
X AccBlI 
X Acc65I 

CCAGATGGGT ACCCTCTTGA 
850 860 



< 
< 



>< Thai 
>< Thai 

>< Mvnl 
>< Mvnl 
>< HinPlI 
X Hin6I 

>< Hhal 

X Cfol 

X BstOI 
>< BstUI 

>< BspSOI 
>< Bsp50I 

>< Acil 

>< AccII 
>< Mnll >< SfaNI >< AccII 

TTGCATCAAA GATTTTCTCG CACGCGCGGG CAAGTCAATG TGCACTCTTT 
870 880 890 900 910 



VneI 
Snol 
>< Sdul 
NspII >< 
HgiAI >< 
Bspl286I >< 

>< Bmyl 

> < ApaLI 

> < Alw4 4I 
Alw21I >< 



>< TthHB8I 
X TthHB8I 

>< TaqI 
>< TaqI 

>< Mnll 
>< Ksp632I 
>< Hinfix Plel 

X Earnll04I >< MboII >< Maelll 

x Earl > < BbvIX AccI X Fnu4HI 



Nlalll >< 
X Nlalll 

EcoRII >< 
DsaV X 



CCGAACAACT T GAT T AC AT C GAGTCGAAGA GAGGTGTCTA CTGCTGCCGT GACCATGAGC ATGAAATTGC 
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FIGURE 13.3 
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x T^^r >C "^w 61 SduI X CsP«5I 

w » J?" HhaI >< Ns P IX >< BstBI 

2 BS ^ ><C HaeI1 >< HgiAI >< Bspll9I 

*Z BSt T N ^ ><: E co47III >< BS pl286I X BsiCI 

>< BsiLI >< Cfol >< Bmyl >< B pul4I 

>< Apyl >< Ddel X Bspl43II X Alul X Alw21I X AsuII 

CTGGTTCACT GAGCGCTCTG ATAAGAGCTA CGAGCACCAG ACACCCTTCG AAATTAAGAG TGCCAAGAAA 

990 1000 1010 1020 1030 1040 1050 

X Tru9I 
>< BsmI >< Msel 

>< BscCI > < MnlI 

TTTGACACTT TCAAAGGGGA ATGCCCAAAG TTTGTGTTTC CTCTTAACTC AAAAGTCAAA GTCATTCAAC 
1060 1070 1080 1090 1100 mo H20 

>< Pmll 
>< PmaCI 
>< Mae II 
>< Eco721 

>< >< MnlI >< DdeI >r A cc" 1071 ^."ss 

CACGTGTTGA AAAGAAAAAG ACTGAGGGTT TCATGGGGCG TATACGCTCT GTGTACCCTG TTGCATCTCC 
1130 1140 1150 H60 1170 1180 H90 

>< SfaNI 

>< Maelll >< Accl Nla T tt w 

ACAGGAGTGT AACAATATGC ACTTGTCTAC CTTGATGAAA TGTAATCATT GCGATGAAGT tVcaTGGCAG 
1200 1210 1220 1230 1240 1250 1260 

>< SinI 
>< Sau96I 
PssI >< 

>< PspSlI 
>< PpuMI 
>< NspIV 

>< NspHII 
>< Eco47l 
>< Drall 
>< Cfrl3I 
>< BsiZI 
>< Bmel8l 
>< Avail 

>< Maell >K AsuI 

ACGTGCGACT TTCTGAAAGC CACTTGTGAA CATTGTGGCA CTGAAAATTT AgSSSSJ gSSSctJ 
" /U 1280 1290 1300 1310 1320 1330 

Van91I >< 

>< Rsal SinI >< 

>< Nspl Sau96l >< 



>< NlalV 



PflMI >< 



>< Nlalll Ns P IV >K 

>< NspHlX Kpnl NspHII > 

>< Eco64I Eco47I >< 

X Csp6I 
>< BscBI 

>< Banl ^ BsizI >< 

>< Asp718 • BsiYI X 

Bmel8I >< 



Cfrl3l >< 
BslI X 



>< Afal 
>< AccBlI 



Avail >< 
Asul X 
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>< Acc65I >< Sfcl >< Nlalll AccB7I >< 

CATGTGGGTA CCTACCTACT AATGCTGTAG TGAAAATGCC ATGTCCTGCC TGTCAAGACC CAGAGATTGG 
1340 1350 1360 1370 1380 1390 1400 

>< TthHB8I 
>< Taqlx Mnll 
X Hinfl 

>< Ddel >< Plel >< Acil 

ACCTGAGCAT AGTGTTGCAG ATTATCACAA CCACTCAAAC ATTGAAACTC GACTCCGCAA GGGAGGTAGG 
1410 1420 1430 1440 1450 1460 1470 

>< Rmal NlalV >< 

X Mnll >< BsrI 

X Mael >< Bbvl >< Fnu4HI BscBI >< 

ACTAGATGTT TTGGAGGCTG TGTGTTTGCC TATGTTGGCT GCTATAATAA GCGTGCCTAC TGGGTTCCTC 
1480 1490 1500 1510 1520 1530 1540 



>< 



X Pall 
X Haelll 

>< Rmal >< BsuRI >< BsrI 

x Mnll > < Ddel >< BspWI 

X Mael >< BshlX Bgll 

GTGCTAGTGC TGATATTGGC TCAGGCCATA CTGGCATTAC TGGTGACAAT GTGGAGACCT TGAATGAGGA 

1550 1560 1570 1580 1590 1600 1610 



X Maelll 

X Eco31I 
BsrI 
X BsmAI 
X BsalX 
>< Alw26I 



XhoII X 
Sau3AI X 
Ndell >< 
Mfll x 
Mbol >< 
DpnII X 
X Mnll Dpnl > 
BstYI >< 
HphI BspAI X 
Bspl43I > 



> < Tru9I 

> < Msel 
X Maell >< Tru9I 

X Hpal 
x Hindll 
x Hinfl >< Plel X Hindi 
X Alwl x Ddel . X Afllll >< Msel 
TCTCCTTGAG ATACTGAGTC GTGAACGTGT TAACATTAAC ATTGTTGGCG ATTTTCATTT GAATGAAGAG 
1620 1630 1640 1650 1660 1670 1680 



> < Mnll 

> < Ksp632I 

> < Earl 

> < Eamll04I 



x MboII Plel X 

x BstXI >< SfaNI > < Hinfl 

GTTGCCATCA TTTTGGCATC TTTCTCTGCT TCTACAAGTG CCTTTATTGA CACTATAAAG AGTCTTGATT 
1690 1700 1710 1720 1730 1740 1750 



X Styl 
X Maelll 

X EcoT14I 
>< Plel >< Ecol30I 

>< Maelll x BssTlI BslI >< 

X HinfIX Acil X BsaJI BsiYI >< 

ACAAGTCTTT CAAAACCATT GTTGAGTCCT GCGGTAACTA TAAAGTTACC AAGGGAAAGC CCGTAAAAGG 
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TGCTTGGAAC ATTGGACAAC AGAGATCAGT TTTAACACCA CTGTGTGGTT TTCCCTCACA GGCTGCTGGT 
1830 1840 1850 1860 1870 1880 1890 

>< Thai 
>< SfaNI 
>< Mvnl 
>< HinPlI 
>< HinPlI 

>< Hin6I 
>< Hin6I 

>< Hhal 
>< Sau3AI >< Hhal 

It >K Cfo1 > 

it T >< CfGl PS P" > 

s^n t BStUI Ns PBH > 

w t >K BSSHI1 HphI X 

\ BS l >K BSP501 Fnu4 HI X 

X Bspl4 3I >< AccII >< Fnu4HI X Bbvl A i uI > 

GTTATCAGAT CAATTTTTGC GCGCACACTT GATGCAGCAA ACCACTCAAT TCCTGATTTG C AAAG AG C AG 

1900 19 1° 1920 1930 1940 1950 I960 

>< TthHB8I 

X Styl 
>< Ncol 
X Hindll 
X Hindi 
>< Hinll 

X EcoT14I 
X Eco57I 
>< TaqlX Ecol30I 
>< Sail >< Dsal 
>< Rtrl X BssTlI 
>< BsaHI 

^ ui ttt >K Bbi -H>< Nlalll 

X Bbvl >K ACyI >< HgaI 

><: Maell >< Acclx BsaJI HphI >< 

CTGTCACCAT ACTTGATGGT ATTTCTGAAC AGTCATTACG TCTTGTCGAC GCCATGGTTT ATACTTCAGA 
1970 1980 1990 2000 2010 2020 2030 

>< Rsal 

>< Ndel > < Csp6X 

>< BspMI >< Maelll >< BsrI >< Afal >< Ddel 

CCTGCTCACC AACAGTGTCA TTATTATGGC ATATGTAACT GGTGGTCTfG TACAACAGAC TTCTCAGTGG 
2040 2050 2060 2070 2080 2090 2100 

>< StuI 

>< Pall 

>< Haelll 

>< Ecol47I 
>< Sdul >< Ddel 

>< NspII >< BsuRI 

>< Bspl286I >< BshI Dd ei >< 

>< Bmyl >< AatI > < MnlI Bfrl >< 

TTGTCTAATC TTTTGGGCAC TACTGTTGAA AAACTCAGGC CTATCT TTGA ATGGATTGAG GCGAAACTTA 
2110 2120 2130 2140 2150 2160 2170 

>< Tfil 

w « x,t ^ „ ><: HinfI Tthllll >< 

>< SfaNI x Bsgl >< F okI AsdI >< 

GTGCAGGAGT TGAATTTCTC AAGGATGCTT GGGAGATTCT CAAATTTCTC ATTACAGGTG TTTTTGACAT 
2180 2190 2200 2210 2220 2230 2240 
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Tru9I >< 
Msel >< 
Hpal > 
Hindll > 

>< Eco57I Hindi > 

CGTCAAGGGT CAAATACAGG TTGCTTCAGA TAACATCAAG GATTGTGTAA AATGCTTCAT TGATGTTGTT 
2250 2260 2270 2280 2290 2300 2310 

>< Sau3AI 
>< Ndell 
X Mbol 

> < Maelll >< Sau3AI 

X Fbal >< Ndell 

>< DpnII >< PpnII 

>< Dpnl . >< DpnIMboII >< 

>< BspAI >< HinPlI Ddel >< 

>< Bspl43I >< Hin6I >< Bspl43I 

>< TthHBSI >< BsiQI >< Hhal >< MboIBfrl X 

X Taql >< Bell >< Cfol >< BspAI Bbsl >< 
AACAAGGCAC TCGAAATGTG CATTGATCAA GTCACTATCG CTGGCGCAAA GTTGCGATCA CTCAACTTAG 

2320 2330 2340 2350 2360 2370 2380 

>< PvuII 

X Maell >< PspSI 

>< Bstll07I >< NspBII 

>< BsaAI Fnu4HI >< 
>< Bbvl > < Fnu4HI 

>< HphI >< DrdI >< AccI >< Alul " 

GTGAAGTCTT CATCGCTCAA AGCAAGGGAC TTTACCGTCA GTGTATACGT GGCAAGGAGC AGCTGCAACT 
2390 2400 2410 2420 2430 2440 2450 

>< Tru9I 

>< NlalV 

X Msel i 
X Mnll 

X Esp4I ><c ScaI 

X Eco64I ><c RsaI 

X BscBI ><: NlalllMnll >< 

X Nlalll >< BanI Mnll X 

X Aflll ><c TfiI >K Cs P 6T 

x Bbvl >< AccBlI >< Maelll >< Hinfl >< HphI >< Afal 
ACTCATGCCT CTTAAGGCAC CAAAAGAAGT AACCTTTCTT GAAGGTGATT CACATGACAC AGTACTTACC 

2460 2470 2480 2490 2500 2510 2520 

> < Xhol 

X TthHB8 I 
X TthHB8lX Taql 

> < Slal 

> < PaeR7I 

> < NspIII 

X HphI X Hinll 

> < Eco88I 

> < Ccrl 

X Esp3I X BsaHI 

> < Bcol 

>< BsmAI >< Bbill 

> < Aval >< Hgal 
X Taql > < Ama87I>< BsmBI 

X DdelX Mnll >< Alw26I X Acyl >< Alul 

TCTGAGGAGG TTGTTCTCAA GAACGGTGAA CTCGAAGCAC TCGAGACGCC CGTTGATAGC TTCACAAATG 
2530 2540 2550* 2560 2570 2580 2590 
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>< Pall >< Nlalll 
>< Haelll >< Mnll 
>< BsuRI >< Ddel >< Tru9I 
>< Alul >< BsrI >< BshI >< Bfrl >< Msel 

GAGCTATCGT TGGCACACCA GTCTGTGTAA ATGGCCTCAT GCTCTTAGAG ATTAAGGACA AAGAACAATA 



2600 



2610 



2620 



2630 



2640 



2 650 



2660 



>< ScrFI 
>< Mval 
>< EcoRII 
>< MstI >< Ecll36I 

>< HinPlI >< DsaV 
>< Hin6I >< BstOI 

>< Hhal >< BstNI 
>< Fspl >< BsmAI 

>< Fdill >< BsiLI 

>< Cfol X Apyl 
>< Avill >< Alw26I X BsrI 
CTGCGCATTG TCTCCTGGTT TACTGGCTAC AAACAATGTC 
2670 2680 2690 2700 



>< Vnel 

Tru9I >< 
>< Snol 

>< Sdul 
>< NspII 
Msel >< 
>< HgiAI 
Bspl28 6I XBslI X 
BsiYI X 
X Bmyl 
>< ApaLI 
X Tru9I X Alw4 4I 
X Msel >< Alw21I 

TTTCGCTTAA AAGGGGGTGC ACCAATTAAA 
2710 2720 2730 



X Tfil 

>< Maelll >< MboII > < Maelll >< Hinfl Alul X 

GGTGTAACCT TTGGAGAAGA TACTGTTTGG GAAGTTCAAG GTTACAAGAA TGTGAGAATC ACATTTGAGC 



2740 



2750 



2760 



2770 



2780 



2790 



2800 



X Sdul 
>< NspII 
>< HgiAI 

X Maell >< Bspl286I 

>< Hindll >< Bmyl 

X HincII >< Tru9I x Alw21I 

X AflHI >< Msel >< Accl 

TTGATGAACG TGTTGACAAA GTGCTTAATG AAAAGTGCTC TGTCTACACT 
2810 2820 2830 2840 2850 



X Rsal 
>< NlalV 
Maelll X 

X MspIX Kpnl 

>< Hpall 

>< HapII 

> < Eco64I 
>< Csp6I 

>< Tfil X BscBI 

> < BanI 

> < Asp718 
X Hinfl >< Afal 

> < AccBlI 

> < Acc65I 
GTTGAATCCG GTACCGAAGT 

2860 2870 



>< Sau3AI 
>< Ndell 
>< Mbol 
X DpnII 

>< Nspl > < DpnI 

X NspHI >< MboII X BspAI 

X Nlalll > < BsrI > < Bspl43l 

X Ddel x Mnll x AlwNI x Bbsl x AlwNI 

TACTGAGTTT GCATGTGTTG TAGCAGAGGC TGTTGTGAAG ACT T TAC AAC CAGTTTCTGA TCTCCTTACC 
2880 2890 2900 2910 2920 2930 2940 

X Sau3AI 
x Ndell 
x Mbol 
>< DpnII 

x DpnI 
>< BspAI 



FTOTTPP 1^ ft 
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M C M ^SScS 4 ^~T GTAGCTACAT TCTACTTATT^TGATGATGCT GGTGAAGAAA 
2950 2960 2970 zyou 



. >< MboII >< Gsul 

X BsaAI 

™S ~J TGTTCCTTTT ACcScS TGAGGAAGAa'gAGGACGATG CAGAGTG.GA 



>< SfaNI 
>< Mnll 
>< Ksp632I 
X Earl 
X Eamll04I 



>< Mnll 
> < MboII 
X MboII 



>< MboII 
X MboII 



> < Rsal 
X Rsal 

X Nlalll 

>< Mnll 

X Csp6I 
X Csp6I 

> < Af al 
X Afal 



X Fokl 
Eco31I >< 
X MamI BsmAI >< 
X BsiBI Bsal >< 
X BsaBIAlw26I X 



GGAAGAAGAA ATTGATGAAA CCTGTGAACA TGAGTACGGT ACAGAGGATG ATTATCAAGG TCTCCCTCTG 
3090 3100 3110 3120 



X NlalVX PvuIIX Xranl 
X Eco64I >< PspSI >< TthHB8I 
X Mnll >< Ddel >< TaqI 

X BscBIX NspBII >< Mnll 
>< BanI >< Mnll 

X AccBlI >< Alul X Asp700I 



>< Mnll >< MboII 

X Ksp632I X MboII >< MboII 

X Earl >< BsrI 

X Eamll04I >< MboIIX Bbsl 



GAATTTGGTG C CCT«GCTGA U iAGAGTT?GA GTTGAGGAAG AAGAAGAGGA AGACTGGGTG GATGATACTA 
3160 3170" 3180 3190 3200 

x Tru9I 

X Msel >< Eco57I- 

y< FokI X BsrIX MboII BsrI X' 

SgagcLtc agagattgag ccagaaccag aacctacacc tgaagaacca gttaatcagt ttactggtta 

3230 3240 . 3250 3260 3270 3280 mvv 

. „ QT >< Mnll 

1^ llll 1 >< Tru9I >< flindlix Tru9I >< Drain 

L llli >< Msel >< HincIIX Msel >< BspWI 

tr^SSt actgacaatg ttgccattaa atgtgttgac atcgttaagg aggcacaaag tgctaatcct 

3300 3310 3320 3330 3340 3350 ^JbU 



> < Nlalll 

X BspMI 



X Vnel 
X Snol 

> < 

> < 

> < 

> < 

> < 
X ApaLI 
X Alw4 4I 

> < Alw21I 



Sdul 
NspII 
HgiAI 
Bspl286I 
Bmyl 



X HphI 

ATGGTGATTG TAAATGCTGC^AACATACAC CTGAAACATG GTGGTGGTGT AGCAGGTGCA CXCAACAAGG 
3370 3380 3390 3400 3410 34^U 

X Sau96I 

X Pall 
>< NspIV 

x Haelll 
x Cfrl3I 



x NlalV 



FIGURE 13.9 



1er depot 



23/83 

>K EC ° 641 >< BsuRI 

>< BscBI > < Tru9I >< BsizI 

>J SlT„ mi t t t > < MSSl ><: BshI >< M nll 

>< AccBlIx Nlalll >< Alur >< AsuI M 1T 

CAACCAATGG TGCCATGCAA AAGGAGAGTG ATGATTACAT TAAGCTAAAT GGCCCTCTTA CAGTAGGAGG 

3440 3450 3460 3470 3480 3490 350 0 

>< SinI 
X Sau96l 
>< NspIV 

>< NspHlX NspHII 
X Eco4 7I 
X Cfrl3I 

X Nlalll X BspMI 
X BsiZI 
X Bmel8I 
x Avail Mnll >< 

GTCTTGTTTG CTTTCTGGAC ATAATCTTGc" ^GAAGTGT CTGCAtStG^GGA^L^SaJaTGCA 
3510 3520 3530 3540 3550 3560 3570 

> < Tru9I 
>< Hphl> < Msel 
>< Esp4I 
>< Alul > < Ndel 

>< Afllix Fnu4HI >< Bbvl 
GGTGAGGACA TCCAGCTTCT TAAGGCAGCA TATGAAAATT TCAATTCACA GGACATCTTA CTTGCACCAT 
-*:>80 3590 3600 3610 3620 3630 3640 

Rsal >< 

>< Eco57I >< BcaI CS ?! I T >< 

TGTTGTCAGC AGG CATAT T T GGTGCTAAAC CACTTCAGTC TTTACAAGtI TGCGTGCAGA CGGTTCG^AC 
JM(J 3660 367< > 3680 3690 3700 3710 

>K Bs 9 I >< BspMI 

>< Bcgl/a >< AluI NlalTT 

ACAGGTTTAT ATTGCAGTCA ATGACAAAGC TCTTTATGAG CAGGTTGTCA TGGATTATCT TGATAACCTG 
3730 3740 3750 3760 3770 3780 

l< Sll > < MnlT >K NlaIV • >< ^ Mboll 

>< Mael >< Eco57I >< BscBI >< H infl >< nrioT 

AAGCCTAGAG TGGAAGCACC TAAACAAGAG GAGCCACCAA ACACAGAAGA TtSSaAaS GaSaGAAAT 

J yU 3800 381 ° 3820 3830 3840 3850 

>< Tru9I 

>< StuI 
>< Pall 

>< Msel >< Mnll >< Maelll 
>< Haelll >< EcoC-651 

X TthHB8I x BsS 1 >< BstP f tXI ~ 

>< Afal >< TaqI Aafc l< BstPI 

CTGTCGTACA GAAGCCTGTC GATGTGAAGC CAAAAATTAA GGCCTGCATT GATGAGGTTA CCACAACACT 
JabU 3870 3880 3890 3900 3910 3920 

Tfil x 

Nlalll x 

X Ddel Hinfl x 

SX >< EcoRV >< Hindlll 
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MboII >< Maelll >< Eco32I >< Alul 

ggaagaaSt aagtttctta ccaataagtt actcttgttt gctgatatca atggtaagct ttaccatgat 

3930 3940 3950 3960 3970 3980 J»»u 

>< Nspl 
>< NspHI 

>< Nlalll >< sfaNI 

x Mnl1 > < Ec ° N ^ ^ <r NlaTTT 

>< DdeI >< MboII >< BslI > < Nlalll 

>< DdeI X Bfrl >< HphX >< BsiYI >< Fokl 

£c£»a tgc™ ™,tc tct™ ~;tgc «cc™ ST^TOATC 



>< Spel 

>< Rmal nr.i.iT 

>< Mael >< EcoRVX HphI >< StaNX 

Hr>hT >< EC032I Mnl1 >< DdeI 

TTATCACTAG TGGTGATATC ACTTGTGTTG TAATACCCTC CAAAAAG GCT GGTGGCACTA CTGAGATGCT 

4070 4080 4090 4100 4110 4120 4130 



ScrFI 



>< 



X 



>< 
Rsal 

>< Mval 
>< EcoRII 

>< Ecll36I 
>< DsaV 

Csp6I >< EcoNI 
X BstOI 
>< BstNI 
X BsiLI 
>< BsaJI 
>< BsaAl >< BslI 
>< MboII X Maelix Apyl ^ 

>< Alul >< BsrI >< Afal >< BsiYI £ 

CTCAAGAGCT TTGAAGAAAG TGCCAGTTGA TGAGTATATA ACCACGTACC CTGGACAAGG ATGTGCTGGT 
4140 4150 ' 4160 4170 4180 4190 4200 

>< Tru9I 
>< Msel 

>< DdeI >< Esp4I X RsaI 

>< Mnll X BspWI „ T t* C S2 

>< Fokl X Alul >< Aflll >< Eco57I X Afal 

TATACACTTG AGGAAGCTAA GACTGCTCTT AAGAAATGCA AATCTGCATT TTATGTACTA CCTTCAGAAG 



4210 



4220 



4230 



C ACC TAAT GC^ T AAG GAAGAG ATTCTAGGAA CTGTATCCTG GAATTTGAGA GAAATGCTTG CTCATGCTGA 
4280 4290 4300 4310 4320 4330 4340 



>< Xrnnl 
Ksp632I >< Rmal 

Earl > < Tfiix MboII 
Eamll04I >< Mael 
DdeI ' > < Hinf I 
>< Asp700I 



4240 4250 

>< ScrFI 
>< Mval 
>< EcoRII 

>< Ecll36I 
>< DsaV 
>< BstOI 
>< BstNI 
>< BsiLI 
>< Apyl 



4270 



Nlalll X 
Ksp632I >< 

>< Earl 
Eamll04I >< 

BsmAI X 
Alw26I >< 



>< Zsp2I 
X PpulOI 

>< Nsil 

X Nlalll 



X Vspl 
>< Tru9I 
X Msel 
x MboII 

X Eco57I >< Mphll03I 

FIGURE 13. 11 
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>< Asnl >< EcoT22I >< BspWI 

>< Asel >< Avalll >< Bgll * >< Maell 

AGAGACAAGA AAATTAATGC CTATATGCAT GGATGTTAGA GCCATAATGG CAACCATCCA ACGTAAGTAT 
4350 4360 4370 4380 4390 4400 4410 

X SfaNI 

><c Tru91 > < Hindll >< Tfil >< spel 

><c MseI > < Hinclix Mboll >< Rmaj 

>K Mnl1 >< DrdI x Hinfl >< Mael 

AAAGGAATTA AAATTCAAGA GGGCATCGTT GACTATGGTG TCCGATTCTT CTTTTATACT AGTAAAGAGC 
4420 4 «30 4440 4450 4460 4470 4480 

X Maelll 

Zt m x ><C F ™ 4H * X Muni 

>< AluI ><c AluI >< Acil Maelll >< 

CTGTAGCTTC TATTATTACG AAGCTGAACT CTCTAAATGA GCCGCTTGTC ACAATGCCAA TTGGTTATGT 
4490 4 500 4510 4520 4530 4540 4550 

x Thai 
X Mvnl 

X Mboll 
X HinPlI 
>< HinPlI 

>< Hin6I 
X Hin6I 

X Hhal 
>< Hhal 
X Fnu4HI 

X Cfol 
>< Cfol 
X BstUI 
X BssHIIX BspWI 
X BspSOI 

X AccII >< AluI Hohl x 

GACACATGGT TTTAATCTTG AAGAGGCTGC GCGCTGTATG CGTTCTCTTA AAGCTCCTGC CGTAGTGTCA 
4560 4570 4580 4590 . 4600 4610 4620 



>< Tru9I 
X Nlalll 

X MseI 

>< Mnll 
>< Ksp632I 
x Earl 
>< Eamll04I 
>< Bbvl 



X Tru9I 
>< MseI 

>< AluI 



x Maelll 

>< SfaNI X AlwNI >< Mnll >< Mnllx Dri 

GTATCATCAC CAGATGCTGT TACTACATAT AATGGATACC TCACTTCGTC ATCAAAGACA TCTGAGGAGC 
4630 4640 4650 4660 4670 4680 4690 

>< SinI 
X Sau96I 
>< NspIV 

>< NspHII 
X Eco4 7I 
>< Cfrl3I 
>< BsiZI 
x Bmel8I 
X Avail 
>< Asul 



X Sdul 
X NspII 
X HgiAI 
X Bspl286I 
X Bmyl 
X Alw21I 

ACTTTGTAGA AACAGTTTCT TTGGCTGGCT CTTACAGAGA TTGGTCCTAT 
4700 4710 4720 4730 4740 



>< Rsal 
>< Csp6I 
X Afal 
TCAGGACAGC GTACAGAGTT 
4750 4760 



>< Tru9l 
>< MseI 
>< Esp4I 



X Rsal 
>< HphI 
>< Csp6I 

FIGURE 13.12 



>< Van91I 
X PflMI 
X BslI 
>< BsiYI 



> < TthHB8I 

> < TaqI 
>< Sdul 

X NspII 

X Eco24I 

>< Bspl286I 

>< Bmyl Gsul X 
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>< Aflll >< Maelll >< Afal >< AccB7I >< BanllBpml >< 

AGGTGTTGAA TTTCTTAAGC GTGGTGACAA AATTGTGTAC CACACTCTGG AGAGCCCCGT CGAGTTTCAT 
4770 4780 4790 4800 4810 4820 4830 

X Tru9I 
>< Plel >< EcoNI 
>< Mnll X BslI 
>< BsmAI >< BsiYI 
>< mll >< HphI >< Hinfix Alw26I>< Acil x Msel 

CTTGACGGTG AGGTTCTTTC AC T TGACAAA CTAAAGAGTC TCTTATCCCT GCGGGAGGTT AAGACTATAA 
4840 4850 4860 4870 4880 4890 4900 

>< Alul >< Ndel 

AAGTGTTCAC AACTGTGGAC AACACTAATC TCCACACACA GCTTGTGGAT ATGTCTATGA CATATGGACA 
4910 4920 4930 4940 4950 4960 4970 

>< SinI 
>< Sau96I 
>< NspIV 
X NspHII 

>< Eco47I , 
X Cfrl3I t"-* 111 >< 

X BsiZI >< NlaI " , T 

>< BmelSI > < Mnl1 

X Avail >< Maelll >< Tru9I >< Mnll 

>< AsuI X Fokl X Msel >< BspHI 

GCAGTTTGGT CCAACATACT TGGATGGTGC TGATGTTACA AAAATTAAAC CTCATGTAAA T CAT GAG GGT 
4980 4990 5000 5010 5020 5030 5040 

> < TthHB8I 

x Rsal > < Ta< 3 1 : 

> < Rmal >< SnaBI >< Seal 

> < M ael >< Maell >< Hindi II >< Rsal 
X Csp6I >< EcolOSI >< Csp6I 

X Af al X BsaAI X Alul X Afal 

AAGACTTTCT TTGTACTACC TAGTGATGAC ACACTACGTA GTGAAGCTTT CGAGTACTAC CATACTCTTG 
5050 5060 5070 5080 5090 5100 5110 

X Rsal 

X Nspl 
X NspHI 
X Nlalll 

> < Csp6I X Tru9I Mnl1 > 

X Afllll X Msel * BslI X 

X Afal X Dral BsiYI >< 

ATGAGAGTTT TCTTGGTAGG TACATGTCTG CTTTAAACCA CACAT^AGAAA TGGAAATTTC CTCAAGTTGG 
5120 5130 5140 5150 5160 5170 5180 

X Tru9I >< Tru9I X Rmal 

X Msel >< Msel >< Muni X Mael Alul > 

TGGTTTAACT TCAATTAAAT GGGCTGATAA CAATTGTTAT TTGTCTAGTG TTTTATTAGC AC TTC AACAG 
5190 5200 5210 5220 . 5230 5240 5250 

X SfaNI 
x Sdul 
X NspII 
>< Eco24I 
X Bspl286I 
>< Bmyl HphI > 

X Bbvl Fnu4HI >< 
>< Mnll >< Banll X BspWI 
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CTTGAAGTCA AATTCAATGC ACCAGCACTT CAAGAGGCTT ATTATAGAGC CCGTGCTGGT GATGCTGCTA 
5260 5270 5280 5290 5300 5310 5320 

>< Vnel 
>< Snol 

>< Sdul 

>< NspII 

X HgiAI 

X Bspl286l 

>< Bmyl 
>< ApaLI 

>< Alw44I M , _ _ 

X Alw21I >< A i uI ><: H hT 

ACTTTTGTGC ACTCATACTC GCTTACAGTA ATAAAACTGT TGGCGAGCTT GGTGATGTCA GAGAAACTAT 
5330 5340 5350 5360 5370 5380 5390 

> < SphI 

> < Pael 

> < Nspl 

> < NspHI X Tfil >< Tru9I 
>< Sfcl > < NlalllX Hinfl >< M sel 

GACCCATCTT CTACAGCATG CTAATTTGGA ATCTGCAAAG CGAGTTCTTA ATGTGGTGTG TAAACATTGT 
5400 5410 5420 5430 5440 5450 5460 

>< Rsal 

>< Tru9I > < Csp6I Es > 

X Msel >< Alul >< Afar Aflll > 

GGTCAGAAAA CTACTACCTT AACGGGTGTA GAAGCTGTGA TGTATATGGG TACTCTATCT TATGATAATC 
5470 5480 5490 5500 5510 5520 5530 

>< Rsal 

X MboII 
>< RmalHinfl X 

~ >< X M^^fBbsI 

MSeI Mlam >< Afal 

TTAAGACAGG TGTTTCCATT CCATGTGTGT GTGGTCGTGA TGCTACACAA TATCTAGTAC AACAAGAGTC 
5540 5550 5560 5570 5580 5590 5600 

. , _ >< Rsal 

Z V ! > < DdeI >< c «p6i 

>K Bs ^I >< BspWI >< BspMI >< Afal 

TTCTTTTGTT ATGATGTCTG CACCACCTGC TGAG TAT AAA TTACAGCAAG GTACATTCTT ATGTGCGAAT 
5610 5620 5630 5640 5650 5660 5670 

^ „ t >< Eco31I 

><: RsaI X DdeI 

w „ >< MaeI11 >< BsmAI 

Csp63C >< Bsal Mnll >< 

>< Afal >< Bsri >< Alw26I Lhr > 

GAGTACACTG GTAACTATCA GTGTGGTCAT TACACTCATA TAACTGCTAA GGAGACCCTC TATCGTATTG 

5680 5690 5700 5710 5720 5730 5740 

>< Sstr >< sinl 

>< Sdul >< Sau96I 

>< SacI >< NspIV 
>< NspII >< NspHII 

>< HgiAI > < RsaI >< Maelll 

>< Eco24I >< Eco47I 

X Ecll36II >< C frl3I 

>< Bspl286I ' >< BsiZI 

><: Bmy 1 >< Bmel8I 



FIGURE 13. 14 
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>< Banll >< Avail 

>< Alw21I >< Csp6I>< Asul 

>< Alul > < Afal >< BsrIX AlwNI 

ACGGAGCTCA CCTTACAAAG ATGTCAGAGT ACAAAGGACC AG TG ACT GAT GTTTTCTACA AGGAAACATC 
5750 5760 5770 5780 5790 5800 5810 

>< TthHB8I 

>< TaqI >< Maelll 

TTACACTACA ACCATCAAGC CTGTGTCGTA TAAACTCGAT GGAGTTACTT ACACAGAGAT TGAACCAAAA 
5820 5830 5840 5850 5860 5870 5880 

X Rsal 
>< Csp6I 
>< Sfcl >< Bbvl 
>< Fokl >< Fnu4HI >< Afal 

TTGGATGGGT ATTATAAAAA GGATAATGCT T AC TAT AC AG AGCAGCC TAT AGACCTTGTA CCAACTCAAC 
5890 5900 5910 5920 5930 5940 5950 

Tru9I >< 
Swal X 
Msel >< 

> < Nspl MamI >< 

> < NspHI Dral >< 

> < Nlalll BsiBI >< 
X Afllll BsaBI >< 

CATTACCAAA TGCGAGTTTT GATAATTTCA AACTCACATG TTCTAACACA AAATTTGCTG ATGATTTAAA 
5960 5970 5980 5990 6000 6010 6020 

>< MboII 
>< Alul >< AluIX Maelll 

TCAAATGACA GGCTTCACAA AGCCAGCTTC ACGAGAGCTA TCTGTCACAT TCTTCCCAGA CTTGAATGGC 
6030 6040 6050 6060 6070 6080 6090 

>< Sfcl 

GATGTAGTGG CTAT TGACTA TAGACACTAT TCAGCGAGTT TCAAGAAAGG TGCTAAATTA CTGCATAAGC 
6100 6110 6120 6130 6140 6150 6160 

>< Tru9I 

X ScrFI 
>< Mval 
>< Msel 

X EcoRII 

>< Ecll36I 
>< DsaV 

>< BstOI 

>< BstNI Maell >< 

>< Muni >< BsiLI >< Dral I I 

>< BstXI >< Apyl >< Maell >< BstXI 

CAATTGTTTG GCACATTAAC CAGGCTACAA CCAAGACAAC GTTCAAACCA AACACTTGGT GTTTACGTTG 

6170 6180 6190 6200 6210 6220 6230 

> < Rsal 

X Csp6I MboII >< 

> < AfalX BsrI >< BbsI 
TCTTTGGAGT ACAAAGCCAG TAGATACTTC AAATTCATTT GAAGTTCTGG CAGTAGAAGA CACACAAGGA 

6240 6250 6260 6270 6280 6290 6300 

X Hindll >< MboII 

>< Hindi >< Mnll >< Eco57I 

ATGGACAATC TTGCTTGTGA AAGT CAACAA CCCACCTCTG AAGAAGTAGT GGAAAATCCT, ACCATACAGA 
6310 6320 6330 6340 6350 6360 6370 
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>< Maelll >< Tru9I 

>< Maell >< MseI 

AGGAAGTCAT AGAGTGTGAC GTGAAAACTA CCGAAGTTGT AGGCAATGTC ATACTTAAAC CATCAGATGA 
6380 6390 6400 6410 6420 6430 6440 

>< XhoII 
>< Sau3AI 
>< Nlalll 
>< Ndell 
>< Mfll 
>< Mbol 
X DpnII 

>< Dpnl 
X BstYI 

>< Tru9I >< BspAI 

>K MseI X BspHI X Bspl43I>< Fnu4HI 

> < Maelll >< Mnll >< Bbvl >< Alwl 

AGGTGTTAAA GTAACACAAG AGTTAGGTCA TGAGGATCTT ATGGCTGCTT ATGTGGAAAA CACAAGCATT 
6450 6460 6470 6480 6490 6500 6510 

>< Saul 
>< Rmal 

X Mstll 
X Mael 

>< Eco81I 

>< Ddel 

>< Cvnl 

x Bsu36I 

>< Bse21I 

>< Bfrl> < Tru9I 

3 rU x J >< AxyI> < Mse *>< Muni >< Nlalll 

_ eI ><: AluI >< AocI >< Dral ' >< Bbvl Fnu4HI X 

ACCATTAAGA AACCTAATGA GCTTTCACTA GCCTTAGGTT TAAAAACAAT TGCCACTCAT GGTATTGCTG 
6520 6530 "40 6550 6560 6570 6580 

x Vspl >< Styl 

>< Tru9I X ECOT14I > < DdeI 

x MseI x Ecol30I >< BslI 

X Asnl x BssTlI >K BsiYI 

>< Asel >< BsaJI > < BfrI >K 
CAATTAATAG TGTTCCTTGG AGTAAAATTT TGGCTTATGT CAAACCATTC TTAGGACAAG CAG C AAT T AC 

6590 6600 6610 6620 6630 6640 6650 

X HinPlI 

X Hin6I >< Tru9I 

>< Hhal >< Maellx MseI 

>< Ddel >< Dralll 

X Bbvl x Cfol >< Afllll 
AAC AT CAAAT TGCGCTAAGA GATTAGCACA ACGTGTGTTT AACAAT TATA TGCCTTATGT GTTTACATTA 

6660 6670 6680 6690 6700 6710 6720 

>< Rsal > < RsalX Xbal 

>< Csp6I x Csp6I X Rraal 

X Muni x Afal > < Afal x Mael >< AluI 

TTGTTCCAAT TGTGTACTTT TACTAAAAGT ACCAATTCTA GAATTAGAGC TTCACTACCT ACAACTATTG 
6730 6740 6750 6760 6770 6780 6790 

>< Vspl 
X Tru9I 
>< Nael 
>< Mspl 

X MseI 
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>< Hpall 
>< HapII 
>< CfrlOI >< Fokl 
>< Tru9I >< Asnl 

>< Msel >< SfaNI >< AselX Hphix Maelll 

CTAAAAATAG TGTTAAGAGT GTTGCTAAAT TATGTTTGGA TGCCGGCATT AATTATGTGA AGTCACCCAA 
6800 6810 6820 6830 6840 6850 6860 

>< Tru9I >< Ddel Maelll > 

>< Msel >< Bfrl >< Bbvl 

ATTTTCTAAA TTGTTCACAA TCGCTATGTG GCTATTGTTG TTAAGTATTT GCTTAGGTTC TCTAATCTGT 

6870 6880 6890 6900 6910 6920 6930 

>< Sdul 

>< NspII 

>< HgiAI 

> < Rsal >< Bspl286I 
>< Csp6I >< Bmyl 

X Fnu4HI . > < Afal >< Alw21I 
GTAACTGCTG CTTTTGGTGT ACTCTTATCT AATTTTGGTG CTCCTTCTTA TTGTAATGGC GTTAGAGAAT 

6940 6950 6960 6970 6980 6990 7000 

Tru9I >< 
Msel >< 

X Tru9I > < Maelll >< Fnu4HI 

>< Msel x Maell Bbvl > 

TGTATCTTAA TTCGTCTAAC GTT ACT ACTA TGGATTTCTG TGAAGGTTCT TTTCCTTGCA GCATTTGTTT 
7010 7020 7030 7040 7050 7060 7070 

> < Tfil Rsal X 

>< MamI >< HphI, 

> < Hinfl Csp6I >< . 

X BsiBI >< XmnIX Maelll AluJt > 

X Pleix Hinfl >< BsaBI >< Alul >< Asp700I Afal X V 

AAGTGGATTA GACTCCCTTG ATTCTTATCC AGCTCTTGAA ACCATTCAGG TGACGATTTC AT CGTACAAG 
7080 7090 ' 7100 7110 7120 7130 7140 

X Pall 

X NspBII 
>< Haelll 
X Gdill 

>< Fnu4HI 
x Eael 

X Ddel 
X BsuRI 

X Rmal >< BshI >< BslI 

>< Mael x Aciix BsiYI 

CTAGACTTGA CAATTTTAGG TCTGGCCGCT GAGTGGGTTT TGGCATATAT GTTGTTCACA AAATTCTTTT 
7150 7160 7170 7180 7190 7200 7210 

X BspMI >< Rmal 

>< Alul X Mael 

ATTTATTAGG TCTTTCAGCT ATAATGCAGG TGTTCTTTGG CTATTTTGCT AGTCATTTCA TCAGCAATTC 

7220 7230 7240 7250 7260 7270 7280 



> < Nlalll 



X NlalV 
X Eco64I 

> < Rsal X BscBI 
X Csp6I X BanI 

> < AfalX AccBlI 



Rsal X 

X MboII 
MamI >< 
Csp6I X 
BsiBI X 
BsaBI X 
Afal >< 
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TTGGCTCATG TGGTTTATCA TTAGTATTGT ACAAATGGCA CCCGTTTCTG CAATGGTTAG GATGTACATC 
7290 7300 7 310 7320 7330 7340 7350 

TthHB8I >< 

>< TaqI 
Mnll >< 
Ksp632l >< 
>< Fokl 
>< MboII Earl >< 
>< Nlalll Eamll04I >< 



>< Fokl 



>< Ndel 
>< Ksp632l 
>< Earl 

>< Eamll04I>< Alulx MboII 



TTCTTTGCTT CTTTCTACTA CATATGGAAG AGCTATGTTC ATATCATGGA TGGTTGCATC TCTTCGACTT 
/JbU 7370 7380 7390 7400 7410 7420 



>< Nlalll 
>< BspWI 



>< HinPlI 
>< Hin6l 
>< Hhal 
>< Cfol 
>< BspWI 



XhoII >< 
Sau3AI >< 
Nlalll >< 

Ndell >< 
Mfll >< 
Mbol >< 
Ksp632I 
Earl 

Eamll04I 
DpnII >< 
BstYI >< 
>< Tru9I BspAI >< 
>< Msel Bglll >< 



> 
> 
> 



>< Thai 
>< Mvnl 
>< Mlul 
X BstUI 

X BspSOI X Rsal 
X AflHI x Csp6I 

GCATGATGTG GTATAAGCG? AATCGTGCCA CACGCG^GTgJaCaS ATTGTTAATG^GCATGAAGAG 
qJU 1440 7450 7460 7470 7480 7490 

>< Pall 
>< Haelll 

>< Dsal - . M _ 

>< M boII >< BsuRI >< Muni 

>< Dpnl w Reh T Maelll >< 

>< BSP143I >< Mnll Z™Zji >< Pielx Hinfl ^ aSSS ~ 
ATCTTTCTAT GTCTATGCAA ATGGAGGCCG TGGCTTCTGC AAGACTCACA ATTGGAAtJg tScAATTGT 

7500 7510 7520 7 530 7540 7550 7560 

> JVS Tru « >< 

>*V r SP «sel >< 

X Afal >< GSUl >< MaeIIIDraI >< 

GACACATTTT GCACTGGTAG TACA T ?CATT AGTGATGAJG TTGCtStL TTTGTCACTC CAgSaAAA 

>< Thai 
x Mvnl 
> < HphI 
HinPlI X 

x HinPlI 

>< Hin6l 
>< Hin6I 
Hhal x 

>< Hhal 
Cfol X 

>< Cfol 
>< BstUI 
X BssHII 

> < Bsrl BSP501 ><C 

GACCAATCAA CCCTACTGAC CAGTCATCGT ATATTGTTGA TAGTGTTGCT GTGAAAAATG GCGCG^S 

DU 7660 7670 7680 7690 7700 

ninr ron n i o 
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>< Fokl 

>< BsmAI 

>< Mnll >< Alw26I >< Acil 

CCTCTACTTT GACAAGGCTG GTCAAAAGAC CT AT GAG AG A CATCCGCTCT CCCATTTTGT CAATTTAGAC 
7710 7720 7730 7740 7750 7760 7770 

>< Vspl 
>< Tru9I 
>< Msel 
>< Asnl 

> < AluT >< AseI ><: Bc 9 I/a 

AATTTGAGAG CTAACAACAC TAAAGGTTCA CTGCCTATTA ATGTCATAGT TTTTGATGGC AAGTCCAAAT 
7780 7790 7800 7810 7820 7830 7840 

>< Sfcl >< PvuII 
>< Rsal >< PspSI 

>< Plel >< Csp6I >< NspBII 

>< Hinfl >< Ddel >< Bcgl >< Afal >< Alul 

GCGACGAGTC TGCTTCTAAG TCTGCTTCTG TGTACTACAG TCAGCTGATG TGCCAACCTA TTCTGTTGCT 
7850 7860 7870 7880 7890 7900 7910 



TthHB8I >< 
TaqI >< 
Sail >< 
Rtrl >< 

>< Seal • Hindll > 

>< Rsal >< Tru9I Hindi > 

X Csp6I >< SfaNI X Eco57I 

>< Alul >< Maell >< Afal >< Msel AccI x 

TGACCAAGCT CTTGTATCAG ACGTTGGAGA TAGTACTGAA GTTTCCGTTA AGATGTTTGA TGCTTATGTC 
7920 7930 7940 7950 7960 7970 .7980 

X Tru9I 
X Msel 

> < Esp4I X Sfcl 

> < Aflll >< BspWI >< Alul 
GACACCTTTT CAGCAACTTT TAGTGTTCCT AT GG AAAAAC TTAAGGCACT TGTTGCTACA GCTCACAGCG 

7990 8000 8010 8020 8030 8040 8050 

X PvuII 
>< PspSI 
X NspBII 
>< Fnu4HI 

X Alul >< Bbvl X Alul 

AGTTAGCAAA GGGTGTAGCT TTAGATGGTG TCCTTTCTAC ATTCGTGTCA GCTGCCCGAC AAGGTGTTGT 
8060 8070 8080 8090 8100 8110 8120 

Maelll >< 

X Hindll >< BsmAI >< Ddel 

X Hindi >< FoklX Alw26I >< Bfrl 

TGATACCGAT GTTGACACAA AGGATGTTAT TGAATGTCTC AAACTTTCAC ATCACTCTGA CTTAGAAGTG 
8130 8140 8150 8160 8170 8180 8190 

X XhoII 
Sau3AI >< 

>< Ndell 
X Mfll 
X Mbol 
X Nlalll X Hgal 
X Hinll X DpnII 
Dpnl >< 

FIGURE 13.19 
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Bspl43I >< 
>< BsaHI >< BstYI 

^ M rxr y< MaeIII>< H P hI >< Bbill >< BspAI 

>< Maelll >< HphI >< Nlalll >< AcyI >< Ba JJi 

ACAGGTGACA GTTGTAACAA TTTCATGCTC ACCTATAATA AGGTTGAAAA CATGACGCCC AGAGATCTTG 

8200 8 210 8220 8230 8240 8250 8260 

>< Nspl 

>< NspHI 

>< Nlalll 
>< HinPlI 
>< Hin6I 
>< Hhal 

_ ><C Cfo1 >< BspWI >< Maelll 

GCGCATGTAT TGACTGTAAT GCAAGGCATA TCAATGCCCA AGTAGCAAAA AGTCACAATG TTTCACTCAT 
8270 8280 8290 8300 8310 8320 8330 

>< Nspl 

>< NspHI >< PvuII 

>< Nlalll >< PspSI 

>< EamllOSI >< NspBXI 

X Bbvl >< Fnu4HI 

X Afllll >< A i uI >< BbvI > Fnu4 HT 

CTGGAATGTA AAAG AC T AC A TGTCTTTATC TGAACAGCTG CGTAAACAAA TTCGTAGTGC TGCCAAGAAG 

8340 8350 8360 8370 8380 8390 8400 

>< Rmal 

>< MboII >< MaeI ><c EamllOSI 

AACAACATAC CTTTTAGACT AACTTGTGCT ACAACTAGAC AGGTTGTCAA TGTCATAACT AC T AAAAT CT 

8410 8420 8430 8440 8450 8460 8470 

>< Tru9I 

x Pall 
>< Msel 

x Haelll 
>< Seal >< Esp4I 

>< Rsal >< Tru9I ' >< BsuRI 

X Csp6I >< Msel >< BshI 

>< Afal >< Dral >< Aflll >< Bbvl 

CACTCAAGGG TGGTAAGATT GTTAGTACTT GTTTTAAACT TATGCTTAAG GCCACATTAT TGTGCGTTCT 
8480 8490 8500 8510 8520 8530 8540 

>< Rsal 
>< Csp6I 

X BsrI >< NlaTTT 

>K Fnu4HI >< Afal >< Maelll 

TGCTGCATTG GTTTGTTATA TCGTTATGCC AGTACATACA TTGTCAATCC ATGATGGTTA CACAAATGAA 
8550 8560 8570 8580 8590 8600 8610 

>< Maelll 
> < Maelll 

>< Maelll >< FokI 

ATCATTGGTT ACAAAGCCAT TCAGGATGGT GTCACTCGTG ACATCATTTC TACTGATGAT TGTTTTGCAA 
8620 8630 8640 8650 8660 8670 8680 

>< NS PI r- SfCl > 

. . „ Fnu4HI >< 

It wIttt >K NlaIXI Bbvl X 

>< Nlalll >< Hgal >< BstXI >< B bvl >< alnT 

ATAAACATGC TGGTTTTGAC GCATGGTTTA GCCAGCGTGG TGGTTCATAC AAAAATGACA AAAG^TGCC^ 

8690 8700 8710 8720 8730 8740 8750 
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X ScrFI 
>< ScrFI >< Rsal 

X Mval >< Mspl 
>< EcoRII >< Hpall 
>< Ecll36I>< Neil 
X DsaV X HapII 
X BstOIX DsaV 
X BstNI >< Csp6I 

>< Fnu4H I >< BsiLI >< BcnIDdel X 

>< aiui >< A py J y< AfaT 

TGTAGTAGCT GCTATCATTA CAAGAGAGAT TGGTTTCATA GTGCCTGGCT TACCGGGTAC TGTGCTGAGA 
8760 8770 8780 8790 8800 8810 8820 

> < Maelll x HphI >< Mnll >< BspWI 

GCAATCAATG GTGACTTCTT GCATTTTCTA CCTCGTGTTT TTAGTGCTGT TGGCAACATT TGCTACACAC 
88 30 8840 8850 8860 8870 8880 8890 

Tru9I > 
SfaNI X 
X Rsal 
Msel > 

X BspWI >< Fnu4HI X Csp6I 

X BbvIX Mnll >< Ddel X Afal 

CTTCCAAACT CATTGAGTAT AGTGATTTTG CTACCTCTGC TTGCGTTCTT GCTGCTGAGT GTACAATTTT 
8900 8910 8920 8930 8940 8950 8960 

> < Rmal 
X Mnll 

X Fokl > < MaeI 

TAAGGATGCT ATGGGCAAAC CTGT GCCAT A TTGTTATGAC ACTAATTTGC TAGAGGGTTC TATTTCTTAT 
8970 8980 8990 9000 9010 9020 9030 

ScrFI > 
Mval > 
Mnll X 
EcoRII >< 
EC1136I > 
DsaV X 
BstOI > 
BstNI > 
BsiLI > 
Apyl > 



X Alul 



X 



X 



NlalV 

X 
BscBI 



Fokl 



s v. r\±- u J. 

AGTGAGCTTC G T CC AG AC AC TCGTTATGTG CTTATGGATG GTTCCATCAT ACAGTTTCCT AACACTTACC 



9040 



9050 



9060 



9070 



9080 



9090 



9100 



X SfaNI 
> < Maelll 
x Gsul 
>< Bpml 



X Sfcl 
X Seal 
X Rsal 
X Csp6l 
>< Afal 
x Ddel >< AccI 



X Rsal 

X Nspl 
x NspHI 
X Nlalll 
X Nlalll 
X Csp6I 
x Afal 



TGGAGGGTTC TGTTAGAGTA GTAACAACTT TTGATGCTGA GTACTGTAGA CATGGTACAT GCGAAAGGTC 
9110 9120 9130 9140 9150 9160 9170 

X SstI 
X Sdul 
X SacI 
NspII >< 
HgiAI >< 
Eco24I >< 
Bspl286I >< 



FIGURE 13.21 



1er depot 




35/83 



Ecll36ll ><>< Bmyl 
Banll >< 

>< Tru9I Alw21I >< 

>< Bsirl >< Msel x* ai t 

AGAAGTAGGT ATTTGCCTAT CTACCAGTGG TAGATGGGTT CTTAATAATG AGCATTACAG AGCTCTATCA 
9180 9190 9200 9210 9220 9230 9240 

X Tfil 

X SfaNI >< Hinfl >< Alul ><f MnlT 

GGAGTTTTCT GTGGTGTTGA TGCGATGAAT CTCATAGCTA ACATCTTTAC TCCTCTTGTG CAAcSSgG 
9250 9260 9270 9280 9290 9300 9310 

>< Maelll 

>< Eco57I HphI ><: 

GTGCTTTAGA TGTGTCTGCT TCAGTAGTGG CTGGTGGTAT TATTGCCATa" ^TGgJgaJ^'SgSgCCTA 
yj^U 9330 9340 9350 9360 9370 9380 

>< Rsal 
>< Csp6I >< Nlalll 

It >< Bbvl >< Fnu4 «I 

>< Afllll >< ftfalX HDhI ><T RerMJT 

CTACTTTATG AAATTCAGAC GTGTTTTTGG TGAGTACAAC CATG?TGTTG CTGCTAATG^TTTTGTTT 
JyU 9400 9410 9420 9430 9440 9450 

>< Rsal 
>< NlalV 
■ >< Kpnl 
>< Eco64I > < ScrFI 

>< CspSI > < NciI 

>< BscBI x MspI 

>< Asp718 >< Hpall 

X BanI >< Alul >< H infl 

><c AfaI >< HapII >< piei 

>< AccBlI > < BcnI > < MeI 

TTGATGTCTT TCACTATACT CTGTCTGGTA^CAGCTTACA icT^cll^ 

9470 9480 9490 9500 9510 9520 

>< Rsal 
>< Csp6I 

>< AfaI >< HphI >< HphI 

ACTTGTACTT GACATTCTAT TTCACCAATG ATGTTTCATT CTTGGCTCAC CTTCAATGGT £££t£t 
9540 9550 9560 9570 9580 9 590 

TTCTCCTATT GTGCCTTTTT GGATAACAGC AATCTATGTA TTCTGTATTT CTCTGAAGCA CTGCCATTGG 

yb ^ u 9630 9640 9650 9660 

>< TthHB8I 
>< Rsal 
>< Mnll 
>< Mnll 

X Tru9T >K Tru91 >< Cs P<* 

x mSt ^ *m t ><: PleI >< Bc ^/a >< Taql 

>< Msel x Ddel >< Nlalll >< BbvI q 

TAGTACCTTC 

>< Rsal 

>< Cs P6I >< RsaI 

>< Bc, 3 I X Csp6I >< BsmAI 

FIGURE n.22 
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>< Afal >< Afal >< Alw2 6I 

CTTTGTGTAC CTTTTTGCTC AAC AAG G AAA TGTACCTAAA ATTGCGTAGC GAGACACTGT TGCCACTTAC 
9740 9750 9760 9770 9780 9790 9800 

>< NlalV 
>< Rsal >< Ddel 

>< Csp6I >< BscBI 

>< Afal >< Bfrl Alul >< 

ACAGTATAAC AGGTATCTTG CTCTATATAA CAAGTACAAG TATTTCAGTG GAGCCTTAGA TACTACCAGC 
9810 9820 9830 9840 9850 9860 9870 

X Fnu4HI 

>< Ddel 

>< Fnu4HI >< Bfrl 

>< Bbvl >< Alul >< Bbvl >< Ddel >< AlwNI 

TATCGTGAAG CAGCTTGCTG CCACTTAGCA AAGGCTCTAA ATGACTTTAG CAACTCAGGT GCTGATGTTC 
9880 9890 9900 9910 9920 9930 9940 

>< Sfcl >< Bsml 

>< PstI >< BscCI 

TCTACCAACC ACCACAGACA T CAATC ACT T CTGCTGTTCT GCAGAGTGGT TTTAGGAAAA TGGCATTCCC 
9950 9960 9970 9980 9990 10000 . 10010 



>< Rsal 
>< Nlalll 

>< Maelll 

>< Csp6I >< Tru9I 

>< Afal >< Msel 

GTCAGGCAAA ,GTTGAAGGGT GCATGGTACA AGTAACCTGT GGAACTACAA CTCTTAATGG ATTGTGGTTG 



10020 



10030 



10040 



10050 



10060 



10070 



10080 



>< Fokl 
>< Bstll07I 
>< AccI 



>< Nspl 
>< NspHI 
>< Nlalll 
>< Afllll 



>< Tru9I 
>< Nspl 
>< NspHI 
>< NlalXI 
>< Msel 

>< MboII BspAI >< 
> < Bbsl Bglll >< 



XhoII >< 

Sau3AI >< 

Ndell >< 

Mfll >< 

Mbol >< 

DpnII >< 

BstYI >< 



GATGACACAG TATACTGTCC AAGACATGTC ATTTGCACAG CAGAAGACAT GCTTAATCCT AACTATGAAG 
10090 10100 10110 10120 10130 10140 10150 



Pall > 
Msel > 
Haelll > 
Eael >< 
BsuRI > 

>< Dpnl >< MboII BshI > 

>< Bspl43I >< Alul Ball > 

ATCTGCTCAT TCGCAAATCC AACCATAGCT TTCTTGTTCA GGCTGGCAAT GTTCAACTTC GTGTTATTGG 
10160 10170 10180 10190 10200 10210 10220 

>< Ddel> < Tru9I 

>< Bfrl> < Msel >< Ddel 

CCATTCTATG CAAAATTGTC TGCTTAGGCT TAAAGTTGAT ACTTCTAACC CTAAGACACC CAAGTATAAA 

10230 10240 10250 10260 10270 10280 10290 



>< ScrFI 
>< Mval 
>< EcoRII 
>< EC1136I 



>< SphI 
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>< DsaV >< Pael 

>< BstOI >< Nspl 

>< BstNI X NspHI 

>< BsiLI >< Rmal X Nlalll 

>< Apyl X Mael >< HphI 
TTTGTCCGTA TCCAACCTGG TCAAACATTT TCAGTTCTAG CATGCTACAA TGGTTCACCA TCTGGTGTTT 

10300 10310 10320 10330 10340 10350 10360 



>< Sau3AI 
>< Ndell 

X MbolX Nlalll 
X Eco31I X DpnII 

x BsmAI >< Tru9I>< Dpnl 

>< Bsaix Nlalll x Tru9I >< Msel X Bspl43I 

X Alw2 6I X Msel X BspAIX Alwl 

ATCAGTGTGC CATGAGACCT AATCATACCA TTAAAGGTTC TTTCCTTAAT GGATCATGTG GTAGTGTTGG 
10370 10380 10390 10400 10410 10420 10430 



X Zsp2X . 
X PpulOI 

X Nsiix SfaNI 
X Ndel 

X Mphll03I Rsal X 

X Tru9I x EcoT22I Csp6I >< 

x Msel > < Avalll X Alul Afal >< 

TTTTAACATT GATTATGATT GCGTGTCTTT CTGCTATATG CATCATATGG AGCTTCCAAC AGGAGTACAC 
10440 10450 10460 10470 10480 10490 10500 



>< SinI 
>< Sau96I 
X NspIV 

>< NspHII 
X Eco47I 
X Cfrl3I 
X BsiZI 
>< Bmel8I 
x Avail 



>< Sfcl 
Rsal X 
PstI X 
X Fnu4HI 

x Rsal x Bmel8I x Hindll * Csp6I x 

x Csp6I>< Ddel x Avail X Hindi >< BspWI 

>< AfalX Bfrl >< Asuix Bsgl X Bbvl X BspMI Afal x 

GCTGGTACTG ACTTAGAAGG TAAATTCTAT GGTCCATTTG TTGACAGACA AACTGCACAG GCTGCAGGTA 
10510 10520 10530 10540 10550 10560 10570 



>< Tru9I x Nlalll 

>< Msel X Bbvl x Fnu4HI HphI X 

CAGACACAAC CATAACATTA AATGTTTTGG CATGGCTGTA TGCTGCTGTT ATCAATGGTG ATAGGTGGTT 
10580 10590 10600 10610 10620 10630 10640 

X Tru9I 

x Tfil 

x Msel X Rsal 

>< HphI X Tru9I x Csp6I 

>< Hinfl X Msel x Afal 

TCTTAATAGA TTCACCACTA CTTTGAATGA CTTTAACCTT GTGGCAATGA AGTACAACTA TGAACCTTTG 
10650 10660 10670 10680 10690 10700 10710 



X SinI 

>< Sau96I 

X PssI 
X PspSII 

X PpuMI 

X NspIV 
X NspHII 
X NlalV 
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>< Eco0109I 
>< Eco47I 
>< Drall 
>< Cfrl3I 
X BsiZI 
>< BscBI 

X Bmel8I >< Ddel 

>< Avail >< Bfrl 

>< Asul >< Mnll X Bbvl 

ACACAAGATC ATGTTGACAT ATTGGGACCT CTTTCTGCTC AAACAGGAAT TGCCGTCTTA GATATGTGTG 
10720 10730 10740 10750 10760 10770 10780 



>< Sau3AI 
>< Ndell 
>< Mbol 

>< Dpnlix Nlalll 

>< Dpnl >< Hindll 
X BspAI X Hindi 
>< Bspl43I 



X 



X 



X Sfcl 
Fnu4HI X Fnu4HI 

X Bbvl X Fnu4HI 

Bbvl X Alul >< PstI 



X Styl 

>< Rsal 

x EcoT14I 
x Ecol30I 

< Csp6I 

X BssTlI 
>< BsaJI 

X Afal 



CTGCTTTGAA AGAGCTGCTG CAGAATGGTA TGAATGGTCG TACTATCCTT GGTAGCACTA TTTTAGAAGA 
10790 10800 10810 10820 10830 10840 10850 



X Styl 

X EcoT14I 

>< Ecol30I 

>< BssTlI 

X MboII > < Maellix BsaJI 

TGAGTTTACA CCATTTGATG TTGTTAGACA ATGCTCTGGT GTTACCTTCC AAGGTAAGTT CAAGAAAATT 
10860 10870 10880 10890 10900 10910 - 10920 

X SfaNI 

> < Sdul 

> < NspII X Tru9I Rsal. x 
X Tru9I> < Bspl28 6I >< Msel X Tfil Csp6I X 
X Msel > < Bmyl >< Fokl >< Hinfl Afal >< 

GTTAAGGGCA CTCATCATTG GATGCTTTTA ACTTTCTTGA CATCACTATT GATTCTTGTT CAAAGTACAC 

10930 10940 10950 10960 10970 10980 10990 

x Xmnl >< Muni 

X BsmI Fnu4HI > 

X BscCI BspWI X 

x Maelll >< Asp700I X Bbvl Bbvl > 

AGTGGTCACT GTTTTTCTTT GTTTACGAGA ATGCTTTCTT GC CAT T TACT CTTGGTATTA TGGCAATTGC 
11000 11010 11020 11030 11040 11050 11060 



X Nspl 

X NspHI >< Tru9I 

>< Nlalll >< Msel X BsmI 

X BspWI X Fnu4HIX BspWI X BscCI >< Maelll 

TGCATGTGCT ATGCTGCTTG TTAAGCATAA GCACGCATTC TTGTGCTTGT TTCTGTTACC TTCTCTTGCA 



11070 



11080 



11090 



11100 



11110. 



11120 



11130 



X SfaNI 
X Rmal 

> < Nspl 

> < Nlalll 

X Nhel 

X Tru9l X Mael 

X BspWI X Msel X Accl> < NspHIX Alul 
ACAGTTGCTT ACTTTAATAT GGTCTACATG CCTGCTAGCT GGGTGATGCG TATCATGACA TGGCTTGAAT 
11140 11150 11160 11170 11180 11190 11200 

FIGURE 13 2 5 



>< MamI 

>< HphI 
X BspHI 
>< BsiBI X Nlalll 

>< BsaBI >< Nlalll 
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>< Tru9I 
>< Msel 

> < Rmal > < Esp4I 

> < MaeI >< Eco57I 

X Alul > < Aflll 

TGGCTGACAC TAGCTTGTCT GGTTATAGGC TTAAGGATTG TGTTATGTAT 

H^3U 11240 11250 11260 11270 

>< Rmal 

>< Maell 
>< MaeI 

> < Nlalll >< sfaNI >< Fnu4HI 

>< BspHI >< Alul >< Bbvl >< AflTTT 

TATTCTCATG ACACC.CGGA GTG^GA TGATGCTGCT AGACGTGTTT GGACACTGAT GAATGTCATT 

j.i.ozu 11330 1134 0 

>< Sau96I 

>< Pall 

>< NspIV" 

><• Nlalll 

>< Haelll 
>< Sau3AI > < DdeI 

>< Ndell >< C frl3I 

>K Mb** - X BsuRI 

X DpnII >< Bsi2I 

>< D PnI >< BshI 

>< Bspl43l > < BfrI 

aga™ ^caaag^S™ -«SgKyg, 

>< Rmal 
>< Nlalll 

. X Maelll. >< MnlI >< MaeIII ><: MaeI >< Sfcl 

CTGTAACCTC „G, G„A CGACTATCAT „JG 

X B T DdeI > 

—as —ss —ss — jss ~e Hsi 

x Pall 
>< Haelll 
>< Fnu4HI >< BsuRI 
X Bbvl >< Fnu4HI >< BspWI 

S£S« g^Sg g™gc SS^S SSSjcS SaSJcagg cttactcttg 

J.101U 11 d2 0 

X ScrFI 

>< Mval 
X EcoRII 

X Ecll36I 
>< DsaV 

>< BstOI 

_ >< BstNI 

Eco311 X BsiLI 

>< BsmAI > < BsaJI 
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X DrdI >< Alw26I >< Apyl Ddel >< 

GTGTTTATGA CTACTTGGTC TCTACACAAG AATTTAGGTA TATGAACTCC CAGGGGCTTT TGCCTCCTAA 
11630 11640 11650 11660 11670 11680 11690 

>< Tru9I 
>< Msel 

>< SfaNI > < HindIII> < Tru9I 

>< Mnll >< Alul > < Msel > < Mnll > < Nlalll 

GAGTAGTATT GATGCTTTCA AGCTTAACAT TAAGTTGTTG GGTATTGGAG GTAAACCATG TATCAAGGTT 
11700 11710 11720 11730 11740 11750 11760 

>< Vnel 
>< Snol 

>< Sdul 
>< NspII 
>< HgiAI 
>< Bspl286I 
>< Bmyl >< Rsal 
>< Rsal >< ApaLI >< MboII 

>< Csp6I >< Alw4 4I >< Csp6I Ddel > 

>< Afal >< Maell >< Alw21I >< Afal Bfrl > 

GCTACTGTAC AGTCTAAAAT GTCTGACGTA AAGTGCACAT CTGTGGTACT GCTCTCGGTT CTTCAACAAC 
11770 11780 11790 11800 11810 11820 11830 



>< NspII> < Rsal 

>< Dralll 
>< SduIX Csp6I 
>< MboII >< Bspl286I 

>< Hinfl >< Plel >< Bmyl > < Afal >< MboII 

TTAGAGTAGA GTCATCTTCT AAATTGTGGG CACAATGTGT ACAACTCCAC AATGATATTC TTCTTGCAAA 



11840 



11850 



11860 



11870 



11880 



11890 



11900 



>< TthHB8I 

>< TaqI Sfcl >< 

>< HindllX X MboII >< Nlalll 

>< Alul > < Eco57I >< BspWI AccI >< 

AGACACAACT GAAGCTTTCG AGAAGATGGT TTCTCTTTTG TCTGTTTTGC TATCCATGCA GGGTGCTGTA 
11910 11920 11930 11940 11950 11960 11970 



>< Vspl 
>< Tru9I 
>< Msel 
>< Asnl 

X Aseix Mnll >< Bcgl/a 



> < Ksp632I 
X TthHB8I > < Earl 

X TaqI >< MboII - > < Eamll04I 

X Eco57I >< Eco57I X Bcgl 



GACATTAATA GGTTGTGCGA GGAAATGCTC GATAACCGTG CTACTCTTCA GGCTATTGCT TCAGAATTTA 
11980 11990 12000 12010 12020 12030 12040 



X Fnu4HI 



X StuI 
>< ScrFI 

x Pall 
>< MvalX Haelll 
X EcoRIlx Ecol47I 

X Ecll36I 
X DsaV X BsuRI 
X BstOI 
X BstNI 

>< BspWI 
X BsiLI 
X BsaJI X BshI 



x Ndel 



X BspWIX Mnll X Bgll 



X Acil 



X ApylX AatI 



Tfil >< 
X Sfcl Hinfl >< 
> < Alul 



FIGURE 13. 27 
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GTTCTTTACC ATCATATGCC GCTTATGCCA CTGCCCAGGA GGCCTATGAG CAGGCTGTAG CTAATGGTGA 
12050 12060 12070 12080 12090 12100 12110 

>< Xmnl >< Tru9I ><c 

>< AsJtOOI ^1^51 >K DdeI 

TTCTGAAGTC GTTCTcL^ AGTTAAAGAA^ ATCT TTGAAT GTGGCTAAAT CTGaSJ^cS^Jgct 
12120 12130 12140 12150 12160 12170 12180 

XhoII X 
Sau3AI >< 
Ndell >< 

Mnll > 
>< Mnll 
>< Mfll 
>< Mbol 
DpnII >< 
Dpnl >< 
DdeI >< 
BstYI >< 
RsalBspAI >< 
>< Csp6IBspl43I >< 
>< AfalBglH >< 



> < Sau3AI 

> < Ndell 

> < Mbol 

> < DpnII 
>< Dpnl 

>< BspWI 

> < BspAI 

GCCftTGCAAC GCAAGTTGGA AAAGATGGCA GA^GC^GACCCAAAT G^CaIaSI'S^GATCTG 
12190 12200 12210 12220 12230 12240 12250 



>< 



>< Nlalll 



>< Tru9I 
>< Msel 



^ S P eI T >< Ksp632I > < Hindlll 

>< Maelll >< Mboll >< Eamll04I >< BspWI 

>< Mael >< BspWI >< Ear-TX Rfi-T s«r t\i.,t 

AGGACAAGAG GGCAAAAGTA ACTAGTGCTA TGCAAACAAT GCTCTTCACT ATGCTTAGGA AGCtJgaJaA 
12260 12270 12280 12290 12300 12310 12320 

>< Thai 
>< Mvnl 
>< HinPH 
>< Hin61 
>< Hhal 
>< Cfol 
>< BstUI 
>< BspSOl 

tgatgcactt aacaacatta tcaacaatgc gcgtgatggt tgtgttccac tcaacatcat accaSgac? 

12330 12340 12350 12360 12370 12380 12390 

>< Rsal 
>< NlalV 
>< Eco64I 
>< Csp6I 
>< BslI 

>< BsiYlX Kpnl 
>< BscBI 
>< BanI 
>< Asp718 
X Afal 

X AccBlI >< MaeIII 

>< ACC65I RenT ^ 

ACAGCflGCCA MCT CATCC, TGTTGTCCCT CC T AC»C» c*C™ 

>< Zsp2I 
x PpulOI 



>< Fnu4HI 



>< Nlalll 
X BstXI 
X Bbvl 
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X Nsil 

>< Mphll03I 

>< NdelX EcoT221 DdeI ><c 

>< Avalll >< SfaNI >< SfaNI >< Acil Bfrl >< 

TTACATATGC ATCTGCACTC TGGGAAATCC AGCAAGTTGT TGATGCGGAT AGCAAGATTG TTCAACTTAG 
12470 12480 12490 12500 12510 12520 12530 

X Pall 

>< Haelll >< Mnll >< DdelDdel >< 
>< Tru9I>< Nlalll >< BsuRI >< Maelll >< BspWI 

>< Mseix HphI > < Xcmix BshI >< Alul BspWI >< 

TGAAATTAAC ATGGACAATT CACCAAATTT GGCTTGGCCT CTTATTGTTA CAGCTCTAAG AGCCAACTCA 
12540 12550 12560 12570 12580 12590 12600 

Rsal >< 
NlalV X 
Kpnl >< 
>< Fnu4HI 
Eco64I >< 
Csp6I >< 

>< Tru9I BscBI >< 

>< PvuII Asp718 >< 

>< PspSI AfaI >< 

X NspBII >< AcilX Banl 

>< Msel x Hinfl X Plel AccBlI >< 

X Alul > < Sfcl X DdelX BsrI >< PshAI Acc65I X 

GCTGTTAAAC TACAGAATAA TGAACTGAGT CCAGTAGCAC T AC G AC AG AT GTCCTGTGCG GCTGGTACCA 
12610 12620 12630 12640 12650 12660 12670 

X TthHB8I 

X TaqI . 
x Sful 
X NspV 
X Mnll 
X Lspl 
X Csp45I 
>< BstBI 

X Rsal >< Bspll9I 

>< Csp6I >< BsiCI 

>< Alul >< Bpul4I 

>< AfaI >< AsuII 

CACAAACAGC TTGTACTGAT GACAATGCAC TTGCCTACTA TAACAATTCG AAGGGAGGTA GGTTTGTGCT 
12680 12690 12700' 12710 12720 12730 12740 

X XhoII 
>< Sau3AI 
X Ndell 
X Mfll 
X Mbol 
x DpnII 
X Dpnl 

>< BstYI >< Tfil X Rsal 

x BspAI >< Rmal >< Csp6I 

X Bspl43I >< Hinfl >< Csp6IX Rsal 

X Bglll X Mael >< DdeI >< AfalX AfaI 

GG CAT T ACTA TCAGACCACC AAGATCTCAA ATGGGCTAGA TTCCCTAAGA GTGATGGTAC AGGTACAATT 
12750 12760 12770 12780 12790 12800 12810 

X Sau96I 

>< PssI 
>< Pall 
X NspIV 

FIGURE 13.29 
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>< 
>< 
>< 

>< 



>< NlalV 
>< BsrI 

>< BscBI > < Maelll >< 

TACACAGAAC TGGAACCACC TTGTAGGTTT GTTACAGACA CACCAAAAGG GCCTAAAGTG AAATACTTGT 
12820 12830 12840 12850 12860 12870 12880 



>< Haelll 
EcoO109I 
Drall 
Cfrl3I 
>< BsuRI 
Bsi2I 
>< BshI 
Asul 



Rsal > 
Csp6I >< 
Afal > 



>< Sfcl 

> < Mboll 
Maell >< 
>< Fnu4HI >< Rsal 
>< Eco57I >< Csp6l 
x Tru9I > < Bbsl 

>< Msel >< Mnll >< Bbvl >< Alul >< Afal 

ACTTCATCAA AGGCTTAAAC AACCTAAATA GAGGTATGGT GCTGGGCAGT TTAGCTGCTA CAGTACGTCT 
12890 12900 12910 12920 12930 12940 12950 

>< Rsal 
>< Sfcl >< Csp6l 
>< BspWI >< Afal >< BspMI AccI X 

TCAGGCTGGA AATGCTACAG AAGTACCTGC CAATTCAACT GTGCTTTCCT TCTGTGCTTT TGCAGTAGAC 
12960 12970 12980 12990 13000 13010 13020 



X Rmal 

>< Mnll 
>< Mael >< HphI 

CCTGCTAAAG CATATAAGGA TTACCTAGCA AGTGGAGGAC AACCAATCAC CAACTGTGTG AAGATGTTGT 



13030 



13040 



13050 



13060 



13070 



13080 



13090 



>< Rsal >< Rsal 

X Mboll X Csp6I 

X Csp6I X BsrI 

x Afal x Afal >< Maelll x Alul 

GTACACACAC TGGTACAGGA CAGGCAATTA CTGTAACACC AGAAGCTAAC ATGGACCAAG AGTCCTTTGG 

13100 13110 13120 13130 13140 13150 13160 



X SinI 
X Sau96l 
X NspIV 

X NspHXI 
X Nlalll 
x Eco47I 

X EamllOSI 
Cfrl3I 
BsiZI ' 
Bmel8I 
Avail 
Asul> < 



X 
X 
X 
X 
X 



x Xcml 
Plel x 
Hinfl 



>< Tfil 

>< SfaNI X Maelll 

x Nlalll x Fokl x Hinfl 

TGGTGCTTCA TGTTGTCTGT ATTGTAGATG CCACATTGAC CAT CC AAAT C CTAAAGGATT CTGTGACTTG 
13170 13180 13190 13200 13210 13220 13230 



> < Rsal 
X Maell 

x Csp6I x Ddel 

> < Afal >< BsrI >< Bfrl 
AAAGGTAAGT ACGTCCAAAT ACCTACCACT TGTGCTAATG ACCCAGTGGG TTTTACACTT AGAAACACAG 

13240 13250 13260 13270 13280 13290 13300 



>< Thai 
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>< SfaNI 
>< Mvnl 
>< BstUI 

>< Rsal >< B ^ 501 

>< Csp6I ><C Acl1 

X Afal >< Acil >< Sfcl X Maelll >< AccIISfaNI >< 

TCTGTACCGT CTGCGGAATG TGGAAAGGTT ATGGCTGTAG TTGTGACCAA CTCCGCGAAC CCTTGATGCA 
13310 13320 13330 13340 13350 13360 13370 

>< Zsp2I 

> < SfaNI 
>< Mphll03I>< Tru9I 
>< PpulOIX Maell Fnu4HI X 

X Nsil> < Fokl Bs 9l >< 

X EcoT22I X Msel >< BbvI 

X Aciix Avalll >< Dral X Acil >< Fnu4HI Acil >< 

GTCTGCGGAT GCATCAACGT TTTTAAACGG GTTTGCGGTG TAAGTGCAGC CCGTCTTACA CCGTGCGGCA 
13380 13390 13400 13410 13420 13430 13440 

>< Spel 

x Seal 

x Rsal 
x Rmal 
>< Mael 

> < Csp6I >< Sfcl >< Bs P WI 

x BspWI x Afal >< AccI >< Bcgl/a Bcgl > 

CAGGCACTAG TACTGATGTC GTCTACAGGG CTTTTGATAT TTACAACGAA AAAGTTGCTG GTTTTGCAAA 
13450 13460 13470 13480 13490 13500 13510 

x ScrFI 
X Mval 

>< MnlT 
X EcoRII 
X Ecll36I 
x BstOI 
X BstNI 

X BslI 
x DsaV X BsiYX 

X BsiLI >< Plel 

X Apyl > < Fokl x Hinfl 

GTTCCTAAAA ACTAATTGCT GTCGCTTCCA GGAGAAGGAT GAGGAAGGCA ATT TAT TAG A CTCTTACTTT 
13520 13530 13540 13550 13560 13570 13580 

X Nlalll 
X Ksp632I 
X Earl 

X Tru9I ><: Eamll04I 

>< Msel >< BsmAI X Tru9I 

X Mnll >K Alw26I >< MboII >< Msel 

GTAGTTAAGA GGCATACTAT GTCTAACTAC CAACATGAAG AGACTATTTA TAACTTGGTT AAAGATTGTC 
13590 13600 13610 13620 13630 13640 13650 

>< Rsal 
>< NlalV 

> < Nlalll 

X Kpnl 
X HphI 

> < Eco64I 
x Csp6I 

x BscBI 

> < BanI 

> < Asp718 

FIGURE 13.31 
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>< Maelll >< Afal 
>< NspBII > < AccB1I MaeI1 

>< Acil >< Nlalll > < Acc65I > < Hgal 

CAGCGGTTGC TGTCCATGAC TTTTTCAAGT TTAGAGTAGA TGGTGACATG GTACCACATA TATCACGTCA 
13660 13670 13680 13690 13700 13710 13720 

>< Mnll 
>< Maell 

GCGTCTAACT AAATACACAA TGGCTGATTT AGTCTATGCT CTACGTCATT TTGATGAGGG TAATTGTGAT 
13730 13740 13750 13760 13770 13780 13790 

>< Tru9I 

>< Msel >< Maelll >< Muni 

ACATTAAAAG AAATACTCGT CACATACAAT TGCTGTGATG ATGATTATTT CAATAAGAAG GATTGGTATG 
13800 "' ° n * "* n ~ ~ _ ~ ~ ~ " 



13810 



13820 



13830 



13840 



13850 



13860 



>< Thai 
>< Mvnl 
>< Mlul 
>< BstUI 
>< BspSOI 

>< Tfil >< Afllll >< Ddel 

>< Hinfl >< AccII >< Bfrl _ n ± aJt rasej „ 

ACTTCGTAGA GAATCCTGAC ATCTTACGCG TATATGCTAA CTTAGGTGAG CGTGTACGCC AATCATTATT 
13870 13880 13890 13900 13910 13920 13930 



X Rsal 
>< HphI 
>< Csp6I Tru9I X 
>< Afal Msel X 



> < SfaNI 
>< Rsal 
>< Csp6I 
>< Afal 



>< SfaNI 



x 



>< Rsal 
> < Csp6I 
BspWI 

>< Afal 



XhoII 
Sau3AI 
Ndell 
Mfll 
Mbol 
DpnII 
BstYI 
BspAI 



> 
> 
> 
> 
> 
> 
> 
> 



AAAGACTGTA CAATTCTGCG ATGCTATGCG TGATGCAGGC ATTGTAGGCG TACTGACATT AGATAATCAG 



13940 



13950 



13960 



13970 



13980 



13990 



14000 



>< Tru9l 
>< Msel 
>< Dpnl 
>< Bspl43I 

>< Alwl 



>< Rsal 
>< Csp6I 
>< BsrI 
>< Afal 



>< Rsal 

> < HphI 
>< Csp6I 

> < Bbvl 
>< Afal 



< ScrFI 

< Mval 

>< Fnu4HI 
>< EcoRII 

> < Ecll36I 

< BstOI 

< BstNI 
>< BslI 
>< BsiYI 

> < BsiLI 

> < Apyl 
X DsaV X Acil 



> 
> 



> 
> 



GATCTTAATG GGAACTGGTA CGATTTCGGT GATTTCGTAC AAG TAGCACC AGGCTGCGGA GTTCCTATTG 
14010 14020 14030 14040 14050 14060 14070 



>< Tfil 
>< Hinfl 



X SfaNI 
>< Fokl 



X Maml 
>< BsiBI 
>< BsaBI 



>< Rmal 
X Mnll 
>< Mael 
>< Bbvl 



>< SfaNI 
> < Hinfl 
>< Fnu4HIPleI X 
>< Ddel 
>< BspWI Ndel X 



TGGATTCATA TTACTCATTG CTGATGCCCA TCCTCACTTT GACTAGGGCA TTGGCTGCTG AGTCCCATAT 
14080 14090 14100 14110 14120 14130 14140 

>< Sau3AI 
>< Ndell 
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>< Mbol 
>< MamI 
>< DpnII 
>< Dpnl 

>< BspWI 
X BspAI 

X. Bspl43I 
>< BsiBI 

>< BsaBI X Fokl 



>< 
X 
>< 



Xcml 

Tru9I 

Msel 



Tthllll >< 
Mbol I >< 
X Ksp632I 
X Eamll04I 

X BsmAI 
X Earl Aspl X 
X Alw2 6I 



GGATGCTGAT CTCGCAAAAC CACTTATTAA GTGGGATTTG CTGAAATATG ATTTTACGGA AGAG AG ACT T 



14150 



14160 



14170 



X 
X 



X 

X MboII 

X 



TthHB8I 
TaqI 

X Mcrl 

> < Ksp632I 

> < Earl 

> < Eamll04I 
BsmAI > 

X BsiEI> 
Alw26I 



X 

> 
> 
> 



14180 

< SinI 

< Sau96I 

< NspIV 
X NspHII 
X NlalV 
Fokl 

< Eco47I 

< Cfrl3I 

< BsiZI 



14190 



14200 



14210 



X SspIX BscBI 

< Tru9I > < Bmel8I 

< Msel > < Avail 
>< Dral > < Asul 



X Muni 



X 
X 



Tru9I 
Msel 



TGTCTCTTCG ACCGTTATTT TAAATATTGG GACCAGACAT ACCATCCCAA TTGTATTAAC TGTTTGGATG 
14220 14230 14240 14250 14260 14270 14280 

SinI >< 
Sau96I x 
NspIV x 
NspHII > 
Eco47I X 
Cf,rl3I X 
BsiZI x 
Bmel8I >< 

X Tru9I Avail X 

X Fokl >< Msel Asul X 

ATAGGTGTAT CCTTCATTGT GCAAACTTTA ATGTGTTATT TTCTACTGTG TTTCCACCTA CAAGTTTTGG 
14290 14300 14310 14320 14330 14340 14350 



X Spel 
>< Rmal 

>< Mael >< Sspl >< BsrI 

ACCACTAGTA AGAAAAATAT TTGTAGATGG TGTTCCTTTT GTTGTTTCAA CTGGATACCA TTTTCGTGAG 
14360 14370 14380 14390 14400 14410 14420 

X Thalx Esp3I 

X Ddel 
X BstUI 

X BspSOI X BsmBI 
X Mvnix BsmAI 
X HgalX Alul >< Alw2 6I 

>< Fokl >< AccII > < Bbvl 



X Rsal 
>< Hinfl >< Plel 
> < Csp6I 
X Afal 



TTAGGAGTCG TACATAATCA G GAT GTAAAC TTACATAGCT CGCGTCTCAG TTTCAAGGAA CTTTTAGTGT 
14430 14440 14450 14460 14470 14480 14490 

X Zsp2I 
X SphI 
X PpulOI 

>< Pael 
>< Nspl 

FIGURE 13.33 
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>< Sau3AI >< NspHI 

>< Ndell >< Nsil 



>< Mbol >< Nlalll 

>< DpnII >< Mphll03I >< NspI 

> < Dpnl >< Fnu4HI NspHI >< 
>< Fnu4HlX BspWI >< EcoT22I Nlalll >< 

>< BspAI >< BspWI ^ >< BspWI 

> < Bspl43I> < Avalll > < AlwNI >< Rmal >< Bsgl 
>< Alwl x Alul x Alul X Bbvl x Mael >< Bbvl 

ATGCTGCTGA TCCAGCTATG CATGCAGCTT CTGGCAATTT ATTGCTAGAT AAACGCACTA CATGCTTTTC 

14500 14510 14520 14530 14540 14550 14560 

X ScrFI 
>< Neil 
>< Mspl 
X Hpall 

X Fnu4HI >< HapII 

X AlwNI >< DsaV ><: Tru9I 

><: AluI >< Bcnl x Msel 

AGTAGCTGCA CTAACAAACA ATGTTGCTTT TCAAACTGTC AAACCCGGTA ATTTTAATAA AGACTTTTAT 
14570 14580 14590 14600 14610 14620 14630 

>< Tru91 Ddel X 

x Msel >< MboII Bbvl x 

GACTTTGCTG TGTCTAAAGG TTTCTTTAAG GAAGGAAGTT CTGTTGAACT AAAACAC TTC TTCTTTGCTC 
14640 14650 14660 14670 14680 14690 14700 

FokI EcoRV X 

>< Fnu4HI Eco32I X 

AGGATGGCAA CGCTGCTATC AGTGATTATG ACTATTATCG TTATAATCTG CCAACAATGT GTGATATCAG 
14710 14720 14730 14740 14750 14760 14770 

>< Vspl 
>< Tru9I 
x Msel 
X Asnl 

>< Maelll >< Asel 

ACAACTCCTA TTCGTAGTTG AAGTTGTTGA TAAATACTTT GATTGTTACG ATGGTGGCTG TATTAATGCC 
14780 14790 14800 14810 14820 14830 14840 

>< Tru9I 

>< Msel >< pvull 

>< H P aI >< PspSI > < xcml 

X Hindll >< NspBII >< Tru9I Rmal X 

>< Hindi >< Alul x Msel Mael x 
AACCAAGTAA TCGTTAACAA TCTGGATAAA TCAGCTGGTT TCCCATTTAA TAAATGGGGT AAGGCTAGAC 

14850 14860 14870 14880 14890 14900 14910 

X SfaNI >< Thai 

X Sau3AI >< Mvnl 

X Ndell >< BstUI 

X Mbol >< Bstll07I 

X DpnII >< BspWI x FokI 

X Dpnl x Bsp50I 

>K PleI >< Bspl43I x Accllx Ddel 

X HinflX Mnll X BspAI X Alwl >< AccI 

TTTATTATGA CTCAATGAGT TATGAGGATC AAGATGCACT TTTCGCGTAT ACTAAGCGTA ATGTCATCCC 

14920 14930 14940 14950 14960 14970 14980 

>< SstI 
>< Sdul 
X sacl 
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>< Tru9I 
>< Tfil 

X Msel 
X Hinfl 

> < SS >< BspWI > < Alul >< Alul 

™~ ™- ™" SS """SSS """JSSS """EE AGCTGGTGTC 



X NspII 
>< HgiAI 
>< Eco24I 

< Ecll36II 
>< Bspl286I 
>< Bmyl 
>< Banll 
>< Alw21I 

< Alul >< 



>< Seal 
>< SfcIX Rsal 
>< BsmAI >< Csp6I 
>< Alw26I >< Afal 



Rmal X 
> < Mnll 

Mael >< 
>< Fnu4HI 
X Acil 



™f G^SgAC AAA.AGACAG ^™ -™ GTCAATRGCC ~ 

X Tru9I 
>< Msel 

GGTAATTGGA AGAAGGAAG, TI ™G ™aa, ATGTTMAflA C T g™g 

Nspl >< 
NspHI >< 
Nlalll >< 
>< Nlalll 

Ddel >< 
BspWI •">'< 
>< Maelll Bfrl >< 

TGATGTAGAA ACTGCAGACC TTATGGGTTG GGATTATCCA AAATGTGACA GAGCCATGCC TAACATGCTT 

> < Pall 

> < Haelll 

f t III* 1 x Mnll >< MaeI11 SfcI >K 

„,GG ^CGC AAACA.AACA CTTGCTGTAA ™CAC CG^C.ACA 

Tru9I >< 

ScrFI > 
Mval > 
X Msel 
Fokl >< 
EcoRII X 
EC1136I > 
DsaV X 
BstOI > 
BstNI > 
BsiLI > 
Apyl > 



X MstI 
X HinPlI 
>< Hin6I 

> < Hhal 
>< Fspl 

>< Fdill >< Nlalll 

> < CfoIX Tru9I > < Fnu4HI 
7\ i t x Avill Msel Ac 3. 1 *- 

GG TTAGCTAA U CGAGTGTGCG CAAGTATTAA GTGAGATGGT CATGTGTGGC GGCTCACTAT ATGTTAAACC 
15340 15350 15360 15370 15380 li5 ^ yu 



> < 



SfaNI 

X Mspl 
X Hpall 
x HapII 



X 
X 



HphI 
BspWI 



>< Tru9I 
X Msel 



Maelll x 
Alul >< 
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AGGTGGAACA TCATCCGGTG ATGCTACAAC TGCTTATGCT AATAGTGTCT TTAACATTTG TCAAGCTGTT 
15410 15420 15430 15440 15450 15460 15470 

>< DrdI 

Bs P WI >< Alul > < Acil 

ACAGCCAATG TAAATGCACT TCTTTCAACT GATGGTAATA AGATAGCTGA CAAGTATGTC CGCAATCTAC 
15480 15490 15500 15510 15520 15530 15540 

>< Sau3AI 
>< Ndell 
>< Mbol 
> < MamI 

>< Fbal 
>< DpnII 

>< Dpnl 
>< BspHI 
>< BspAI 

>< Bspl43I 
>< BsiQI 

>< Sfcl > < BsiBlX Nlalll 

>< BsmAI > < BsaBlX Fokl 

X Alw26I >< BclIX EcoRI Fokl >< 

AACACAGGCT CTATGAGTGT CTCTATAGAA ATAGGGATGT TGATCATGAA TTCGTGGATG AGTTTTACGC 
15550 15560 15570 15580 15590 15600 15610 

>< Tfil 

>< SfaNI 
>< Nlalll 

X BspMI g >< Hinfl >< MaeTTT 

TTACCTGCGT AAACATTTCT CCATGATGAT TCTTTCTGAT GATGCCGTTG TGTGCTATAA CAGTAACTAT 
15620 15630 15640 15650 15660 15670 15680 

> < Rmal 
>< Nhel X Tru9I 
X Fnu4HI > < Mael >< Tru9I 

><: AciI >< Alul x Msel x Msel MnlI >< 

GCGGCTCAAG GTTTAGTAGC TAG CATT AAG AACTTTAAGG CAGTTCTTTA TTATCAAAAT AATGTGTTCA 
15690 15700 15710 15720 , 15730 15740 15750 

>< SinI 
X Sau96I 

>< PssI 
x PspSII 
x PpuMI 
>< NspIV 

X NspHII 
>< EcoO109I 
>< Eco47l 
>< Drall 
>< Cfrl3I 
>< BsiZI 
>< Ddel >< Bmel8I 

X Nlalll x BsmAI >< Avail 

>< Ddel X Alw26I >< Asul >< MnlI 

TGTCTGAGGC AAAATGTTGG ACTGAGACTG ACCTTACTAA AGGACCTCAC GAATTTTGCT CACAGCATAC 
15760 15770 15780 15790 15800 15810 15820 

>< XhoII 
>< Sau3AI 
>< Ndell 
>< Mfll 
>< Mbol 



T?Tm TT>T7 1 O ^ r- 
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>< Rsal >< DpnII 

>< Maell >< Dpnl > < Sspl 

>< Tru9I >< Csp6I >< BstYI HinPlI X 

>< Rmal >< BsaAI >< BspMI Hin6I >< 

X Mael >< Afllll >< BspAI Hhal X 

X BspWlX Msel >< Afal X AlwIX Bspl4 3I Cfol >< 

AATGCTAGTT AAACAAGGAG ATGATTACGT GTACCTGCCT TACCCAGATC CATCAAGAAT ATTAGGCGCA 
15830 ' 15840 15850 15860 15870 15880 15890 

X Rsal >< SfaNI 

>< TthHB8I >< Csp6I X Maelll 

X TaqI >< Afal BsrI >< 

GGCTGTTTTG TCGATGATAT TGT CAAAAC A GATGGTACAC TTATGATTGA AAGGTTCGTG TCACTGGCTA 
15900 15910 15920 15930 15940 15950 . 15960 

> < Fokl 
X BspWI 

TTGATGCTTA CCCACTTACA AAACATCCTA ATCAGGAGTA TGCTGATGTC TTTCACTTGT ATTTACAATA 
15970 15980 15990 16000 16010 16020 16030 

X Van91I 
X PflMI 
X Nspl 

> < PallX NspHI 

> < MscIX Nlalll 

> < Haelll 

> < BsuRI 
X BsrI 

>< Eael X BslI >< Nspl 

> < Bshix BsiYI X NspHI 
X Nlalll X Afllll X Afllll 

X Maelll >< Alul > < Balix AccB7I X Nlalll 

CATTAGAAAG TTACATGATG AGCTTACTGG CCACATGTTG GACATGTATT CCGTAATGCT AACT£ATGAT 
16040 16050 16060 16070 16080 16090 r . 16100 

X Rsal> < NlalV 
X Mnll. 

X Csp6I X Ddel >< Rsal 

X BsrI X Mnll X Csp6I 

>< Afal> < BscBI >< Afal Sfcl X 

AACACCTCAC GGTACTGGGA ACCTGAGTTT TATGAGGCTA TGTACACACC ACATACAGTC TTGCAGGCTG 

16110 16120 16130 16140 16150 16160 16170 

X NlalV 

X EcoNI 
X Eco31I 
X Eco64lX BsmAI 

X BscBI X BslI 
x BanI >< BsiYI 
x Acil x Bsal 

X BspWI >< AccBlIX Alw26I Bbvl X 

TAGGTGCTTG TGTATTGTGC AATTCACAGA CTTCACTTCG TTGCGGTGCC TGTATTAGGA GACCATTCCT 
16180 16190 16200 16210 16220 16230 16240 

X Tthllll 

X Fnu4HI X Nlalll > < Tru9I 

X BspWI X Aspl > < Msel 

ATGTTGCAAG TGCTGCTATG ACCATGTCAT TTCAACATCA C ACAAAT TAG TGTTGTCTGT TAATCCCTAT 
16250 16260 16270 16280 16290 16300 16310 

X ScrFI 
>< Mval 

FIGURE 13. 37 
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X EcoRII 

>< Ecll36I 
X DsaV 

X BstOI 

X BstNI 

X BsiLI >< Rmal 

X BsaJI >< Mnll BspWI >< 

>< Apyl >< Maelll >< Maelll >< Mael X Alul 

GTTTGCAATG CCCCAGGTTG TGATGTCACT GATGTGACAC AACTGTATCT AGGAGGTATG AGCTATTATT 
16320 16330 16340 16350 16360 16370 16380 

>< Maelll x Mnll 

GCAAGTCACA TAAGCCTCCC ATTAGTTTTC CATTATGTGC TAATGGTCAG GTTTTTGGTT TATACAAAAA 
16390 16400 16410 16420 16430 16440 16450 

X Nspl X Nspl 

X NspHI > < Tthllll X NspHI 

X Nlallix Maellix Maelll X Nlalll 

>< AflHI X Aspl . X Afllll 

CACATGTGTA GGCAGTGACA ATGTCACTGA CTTCAATGCG ATAGCAACAT GTGATTGGAC TAATGCTGGC 
16460 16470 16480 16490 16500 16510 16520 

X Rsal 
x Plel 
x Ddel 
x Csp6I 

X BsmAI >< Hinfl X Mnll 

>< Alw26I >< Hindi 1 1 . Ddel >< 

X Afal X Alul X Fnu4HI x Bbvl 

GATTACATAC TTGCCAACAC TTGTACTGAG AGACTCAAGC TTTTCGCAGC AGAAACGCTC AAAGCCACTG 
16530 16540 16550 16560 16570 16580 16590 

> < Thai 

X Seal 
X Rsal X Rsal 

> < Mvnl 

X Csp6I X Csp6I 

> < BstUI 

> < Tru9I > < BspSOI 

> < Msel > < Ndel X Afal >< Afal 

X Alul > < AccII Mnll > 

AGGAAACATT TAAGCTGTCA TATGGTATTG CCACTGTACG CGAAGTACTC TC TGACAG AG AATTGCATCT 
16600 16610 16620 16630 16640 16650 16660 

Maelll x 
X Maelll 
>< Eco0651 
>< Eco91I 
X BstPI 

X SfaNI >< Rmal X BstEII 

X Nlalll >< Mael X BsrI 

TTCATGGGAG GTTGGAAAAC CTAGACCACC ATTGAACAGA AACTATGTCT TTACTGGTTA CCGTGTAACT 
16670 16680 16690 16700 16710 16720 16730 

Rsal x 
X Mnll 

>< Rsal x Rsal >< HphI 

>< Csp6I >< Csp6I >< SfaNI Csp6I >< 

>< Afal >< Afal >< Maelll >< HphI Afal X 

AAAAATAGTA AAGTACAGAT TGGAGAGTAC ACCTTTGAAA AAGGTGACTA TGGTGATGCT GTTGTGTACA 
16740 16750 16760 16770 16780 16790 16800 



FIGURE 13.38 
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X Rsal >< H P hI 

>< Csp6I >< Hindll Ddel >< 

>< AfaI >< Hindi Bfrl X 

GAGGTACTAC GACATACAAG TTGAATGTTG GTGATTACTT TGTGTTGACA TCTCACACTG TAATGCCACT 

16810 16820 16830 16840 16850 16860 16870 



>< Vnel 
>< Snol 

>< Sdul 
>< NspII 
>< HgiAI 
>< Dralll 

>< Bspl286I 
>< Bmyl 
>< ApaLI >< Rmal 
>< Alw4 4I >< Mael 
>< Alw21I 



> < Sdul 

> < NspII 

> < HgiAI 
>< BspWI >< Drain 

> < Bspl286I 

> < Bmyl >< 

> < Alw21I >< AfaI Ddel > 
TAGTGCACCT ACTCTAGTGC CACAAGAG C A CTATGTGAGA ATTACTGGCT TGTACCCAAC ACTCAACATC 

16880 16890 16900 16910 16920 16930 16940 



>< Rsal 
>< Csp6I 
BsrI 

>< AfaI 



Styl >< 

SinI > 
Sau96I > 
NspIV > 
EcoT14I X 

Eco47I > 
Ecol30I >< 
>< Seal Cfrl3I > 
BssTlI >< 
>< SphI >< Rsal --BsiZI > 
>< Pael BsaJI >< 

X Nlalll Bmel8I > 

x Rmal >< Nspix Csp6I Avail > 

>< Mael >< NspHIx AfaI Asul > 

TCAGATGAGT TTTCTAGCAA TGTTGCAAAT TATCAAAAGG TCGGCATGCA AAAGTACTCT ACACTCCAAG 
16950 16960 16970 16980 16990 17000 17010 



X ScrFI 

X Rsal 
x Mval 
X EcoRII 
X Ecll36I 

> < Csp6I 
X BstOI 
X BstNI 
x Xcml >< BslI 
X NspHII X BsiYI 
X BsiLI 

>< Apyl >< BsrI 
X DsaVX AfaI > < HinfIX Plel 
GACCACCTGG TACTGGTAAG AGTCATTTTG CCATCGGACT TGCTCTCTAT TACCCATCTG CTCGCATAGT 
17020 17030 17040 17050 17060 17070 17080 



X 

X SphI 
X Pael 
>< Nspl 
>< NspHI 
X Bstll07I > 
X AccI . >< Nlalll 
GTATACGGCA TGCTCTCATG 
17090 17100 



SfaNI 

X PvuII 
X PspSI 
X NspBII 

x Fnu4HI > < Tru9I 

< NlalllX BspWI X Sspl 

X Alul >< Bbvl > < Msel 

CAGCTGTTGA TGCCCTATGT GAAAAGGCAT TAAAATATTT GCCCATAGAT 
17110 17120 17130 17140 17150 



FIGURE 13.39 
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> < Thai 
>< Thai 

> < Mvnl 
>< Mvnl X Thai 

> < HinPlI 
>< HinPlI 

>< HinPlI >< Mvnl 

> < Hin6I 
>< Hin6I 

> < Hhal 
>< Hhal 

> 

>< Cfol 
> 

>< BstUI 



>< Hhal 

< Cfol 
>< Cfol 

< BstUI 
X BstUI 



>< BssHII 
>< BspMI 

> < Bsp50I 

>< BspSOlX BspSOI Rmal > 

X Tfil >< Hin6I> < AccII , Mael > 

X Hinfl >< AccII X AccII > < EcoRI 

AAATGTAGTA GAATCATACC TGCGCGTGCG CGCGTAGAGT GTTTTGATAA ATTCAAAGTG AAT TCAACAC 
17160 17170 17180 17190 17200 17210 17220 

X Zsp2I 
X PpulOI 

>< Nsil 

X Mphll03I 

X EcoT22I 

>< Bsgl > < Avalll >< DrdI 

TAGAACAGTA TGTTTTCTGC ACTGTAAATG CATTGCCAGA AACAACTGCT GACATTGTAG TCTTTGATGA 
17230 17240 17250 17260 17270 17280 17290 



>< Rmal 

>< Mael >< Maell 

AATCTCTATG GCTACTAATT ATGACTTGAG TGTTGTCAAT GCTAGACTTC GT GCAAAAC A CTACGTCTAT 
17300 17310 17320 17330 17340 17350 17360 

X Sau3AI 
X Ndell 
>< Mbol 
X DpnII 
>< Dpnl 

X BspAI >< Rruax 

X Alwix Bspl43I > < Acil >< Mael Sspl X 

ATTGGCGATC CTGCTCAATT ACCAGCCCCC CGCACATTGC TGACTAAAGG CACACTAGAA CCAGAATATT 



17370 



17380 



17390 



17400 



17410 



17420 



17430 



X SinI 
X Sau96I 

X NspIV x Styl 

>< NspHII X Nspl 

X Eco47I >< NspHI 

>< Cfrl3I x Nlalll 

>< BsiZI >< EcoTl4I 

>< Bsgl x Ecol30I 

>< Bmel8I X BssTlI 

X Tru9I >< Avail x BsaJI 

>< Msel >< Asul> < AflHI 

TTAATTCAGT GTGCAGACTT ATGAAAACAA TAGGTCCAGA CATGTTCCTT GGAACTTGTC GCCGTTGTCC 

17440 17450 17460 17470 17480 17490 17500 

FTGTJRF. n dd 
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>< Hindll 

>< Hindi >< Alul 

TGCTGAAATT GTTGACACTG TGAGTGCTTT AGTTTATGAC AATAAGCTAA AAGCACACAA GGATAAGTCA 

17510 17520 17530 17540 17550 17560 17570 

>< Alul >< Nlalll 

GCTCAATGCT TCAAAATGTT CTACAAAGGT GTTATTACAC ATGATGTTTC ATCTGCAATC AACAGACCTC 

17580 17590 17600 17610 17620 17630 17640 

>< Mnll 
>< EcoNI 

>< BslI >< HphI 

>< BsiYI >< Alul 

AAATAGGCGT TGTAAGAGAA TTTCTTACAC GCAATCCTGC TTGGAGAAAA GCTGTTTTTA TCTCACCTTA 

17650 17660 17670 17680 17690 17700 17710 

>< Sfcl X Ddel >< Tfil 

> < Alul >< Bfrl >< Hinfl 

T AATT CAC AG AACGCTGTAG CTTCAAAAAT CTTAGGATTG CCTACGCAGA CTGTTGATTC ATCACAGGGT 

17720 17730 17740 17750 17760 17770 * 17780 

> < Hindll 

>< Tthllll > < Hindi 

>< Aspl >< AciI 

TCTGAATATG ACTATGTCAT ATTCACACAA ACT AC TGAAA CAGCACACTC TTGTAATGTC AACCGCTTCA 

17790 17800 17810 17820 17830 17840 17850 



>< XhoII 
>< Sau3AI 
>< Ndell 
X Mfll 
>< Mbol 
>< MamI 
x DpnII 

>< Dpnl 
X BstYI 
>< BspAI 

>< Bspl43I 
>< BsiBI 
X BsaBI 
X BspWI x Bglll 

ATGTGGCTAT CACAAGG GCA AAAATTGGCA TTTTGTGCAT AATGTCTGAT AGAGATCTTT AT G ACAAACT 
17860 17870 17880 17890 17900 17910 17920 

>< Xbal 

x Rmal >< Maelll 

>< Mael >< Maell BsrI >< 

GCAATTTACA AGTCTAGAAA TACCACGTCG CAATGTGGCT AC AT TAC AAG CAGAAAATGT AACTGGACTT 



17930 



17940 



17950 



17960 



17970 



17980 



17990 



>< Tru9I 

>< MselX Sfd 



X Sau3AI 
>< Ndell 

X Mbol I 
X Mbol 

> < Fokl 
x DpnII 

>< Dpnl 
X BspAI 

X Bspl4 3I 

X Bbsl > < BsrI 



X NlalV 
>< Eco64I 

>< BscBI 
>< BanI 
>< AccBlI 



Mnll X 
X Ddel 



FIGURE 13. 41 
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TTTAAGGACT GTAGTAAGAT CATTACTGGT CTTCATCCTA CACAGGCACC TACACACCTC AGCGTTGATA 
18000 18010 18020 18030 18040 18050 18060 



>< ScrFI 
X Mval 
>< EcoRII 
>< Eco57I 

>< EC1136I 
>< DsaV 
>< BstOI 
>< BstNI 
>< HindllX BsiLI 
>< Hind IX Apyl 

TAAAGTTCAA GACTGAAGGA TTATGTGTTG ACATACCAGG CATACCAAAG GACATGACCT ACCGTAGACT 
18070 18080 18090 18100 18110 18120 18130 



>< Plel 
>< Nlalll 

Hinfl >< 
AccI >< 



>< Maelll Thai >< 

>< Eco0651 Mvnl >< 

>< Eco91I BstUI >< 

>< BstXI BspSOI >< 

x BstPI X Acil 

>< BstEII x HphI AccII x 

CATCTCTATG ATGGGTTTCA AAATGAATTA CCAAGTCAAT GGTTACCCTA ATATGTTTAT CACCCGCGAA 

18140 18150 18160 18170 18180 18190 18200 

>< XmnI 

> < MboII >< sfaNI 

> < Maelll >< Rjnax 
X Asp700I >< Nlalll 

>< Alul >< Maell x Mnll >< Mael 

GAAGCTATTC GTCACGTTCG TGCGTGGATT GGCTTTGATG TAGAGGGCTG TCATGCAACT AGAGATGCTG 



18210 



18220 



18230 



18240 



18250 



18260 



18270 



>< Rsal 
>< Gsul 

X Csp6I ' 
>< Bpml 
X Afal 



>< Rmal 

X Mnll 
x Mael 
>< Alul 



x Sfcl 



X Tru9I 

>< Msel 
x Hpal 
>< Hindll 
>< Hindi 



>< Rsal 
X Csp6I 
>< Ddel X Alul BsrI X 
>< Bfrl X Afal 



TGGGTACTAA CCTACCTCTC CAGCTAGGAT TTTCTACAGG TGTTAACTTA GTAGCTGTAC CGACTGGTTA 
18280 18290 18300 18310 18320 18330 18340 



X Hindll 
>< Hindi 



>< 



HphI 

X EcoRI 



x Tru9I 
>< Msel 

RTOTTPP? M AO 



x ScrFI 
>< Mval 

>< Mnll 
>< Maelll 
X EcoRII 

x Ecc-0651 
X EcoNI 

X Eco91I 
X Ecll36I 
X DsaV Tru9I X 
>< Drain 
x BstPI 
>< BstOI 

X BstNI Pmel X 
X BstEII 
>< BslI Msel X 
X BsiYI HphI X 
>< BsiLI Dral x 
>< Apyl X BsrI 
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TGTTGACACT GAAAATAACA CAGAATTCAC CAGAGTTAAT GCAAAACCTC CACCAGGTGA CCAGTTTAAA 
18350 18360 18370 18380 18390 18400 18410 

>< ScrFI 
>< Mval 
>< EcoRII 

>< Ecll36I 
>< DsaV 
>< BstOI 
X BstNI 
>< BsiLI 
>< BsaJI 
>< Nlalll >< Apyl 

CATCTTATAC CACTCATGTA TAAAGGCTTG CCCTGGAATG TAGTGCGTAT T AAGAT AG T A CAAATGCTCA 
18420 18430 18440 18450 18460 18470 18480 



>< Rsal 
Ddel 

> < Tru9I>< Csp6I 

> < Msel >< Afal 



X 



>< Nlalll 
>< HinPlI 
>< Tthllll >< Hin6I 

X Hinfl > < Hhal 

X Aspl >< Plel > < Cfol >< Alul 

GTGATACACT GAAAGGATTG TCAGACAGAG TCGTGTTCGT CCTTTGGGCG CATGGCTTTG AGCTTACATC 

- - • - - ~ " ~ ~ "* ° ° A 18540 1 K H ( ! 



18490 



18500 



X Seal 
>< Rsal 
X Csp6I 
x Afal 



18510 

>< SinI 
>< Sau96I 
>< NspIV 

X NspHII 
X Eco47I 
>< Cfrl3I 
X BsiXI 
X Bmel8I 
X Avail 
X Asul 



18520 



18530 



18550 



X Maell 

. . i x AflHI >< Maellix Maell 

AAT GAAGTAC TTTGTCAAGA TTGGACCTGA AAGAACGTGT TGTCTGTGTG ACAAACGTGC AACTTGCTTT 
^ 3 18560 18570 18580 18590 18600 18610 18620 



> < Tfil >< Tthllll 

> < Hinfl > < Aspl 

TCTACTTCAT CAGATACTTA TGCCTGCTGG AATCATTCTG TGGGTTTTGA CTATGTCTAT AACCCATTTA 
18630 18640 18650 18660 18670 18680 18690 

X ScrFI 
Rsal x 
• >< Mval 
X EcoRII 
Ecll36I >< 

x DsaV 
Csp6I >< 

BstXI X 
X BstOI 
X BstNI 
X BsiLI 
X Apyl 
Afal X 



18700 18710 

X SfaNI 
X Rmal 
X Nspl 
X NspHI 



> 


< Maell I 






> 


< Eco0651 






> 


< Eco91I 






> 


< BstPI 






X Eco57I> 


< BstEII 


X Maelll 


X Nlalll 


GGCTTTACGG 


GTAACCTTCA 


GAGTAACCAT 


GACCAACATT 


18720 


18730 


18740 


18750 



18760 



FIGURE 13.43 
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>< Nlalll 

>< Mael 
>< Nlalll >< BspWI 
> < AflHI 
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>< Rmal 
>< Nlalll 
>< Mael 
>< BspHI 



Tru9I X 
>< Nlalll 

Msel >< 



TGGAAATGCA CATGTGGCTA GTTGTGATGC TATCATGACT AGATGTTTAG CAGTCCATGA GTGCTTTGTT 
18770 18780 18790 18800 18810 18820 18830 

>< Thai 

>< Mvnl 
>< HinPlI 
>< Hin6I 



>< 
>< 
>< 
>< 
>< 



Hhal 
Cfol 
BstUI 
BspSOI 
AccII 



>< EcoNI> < Mnll 

X BslI >< Tru9I 

>< BsiYI >< Ddel >< Msel 

AAGCGCGTTG ATTGGTCTGT TGAATACCCT AT TAT AGGAG ATGAAC T GAG GGTTAATTCT GCTTGCAGAA 
18840 18850 18860 18870 18880 18890 18900 



>< Rsal 

>< Csp6I >< MboII > < Nlalll 

>< Afal >< Nlalll >< BspWI >< BsrI >< BspHI 

AAGTACAACA CATGGTTGTG AAGTCTGCAT TGCTTGCTGA TAAGTTTCCA GTTCTTCATG ACAT TGGAAA 
18910 18920 18930 18940 18950 18960 18970 

>< Saul 
>< Mstll 
X Eco81I 

>< Ddel Nlalll >< 

>< Cvnl >< Espl 

>< Bsu36I >< Eco57I Maelll >< 

>< Bse21I >< Ddel 

>< Axyl >< Celll 

X AocI x Mnll X SfaNI X Bpull02I 

TCCAAAGGCT ATCAAGTGTG TGCCTCAGGC TGAAGTAGAA TGGAAGTTCT ACGATGCTCA GCCATGTAGT 

18980 18990 19000 19010 19020 19030 19040 

>< Mnll >< Ksp632I 

>< Hindi II >< Earl 

x Alul x MboII >< Eamll04I 

GACAAAGCTT ACAAAATAGA GGAACTCTTC TATTCTTATG C T AC AC AT CA CGATAAATTC ACTGATGGTG 
19050 19060 19070 19080 19090 19100 19110 

>< Sau3AI 
X Ndell 
x Mbol 
X MaeII> < Maelll 
>< DpnII 
>< Dpnl 

X BspAI Hinfl > 

x Maelll >< Bspl43I >< Muni DrdI X 

TTTGTTTGTT TTGGAATTGT AACGTTGATC GTTACCCAGC CAATGCAATT GTGTGTAGGT TTGACACAAG 
19120 19130 19140 19150 19160 19170 19180 



X ScrFI 
X Mval 
X EcoRII 



Zsp2I X 

>< SphI 
> < PpulOI 
x Pael 
>< Nspl 
>< NspHI 
>< Nlalll 
Mphll03I X 
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>< Ecll36I x Gsul 

>< DsaV ECOT22I >< 

>< BstOI >< BsmI 

>< BstNI >< BscCI 

>< BsiLI >< Bpml >< Nsil 

>< Plel >< Apyl >< Avalll 
AGTCTTGTCA AACTTGAACT TACCAGGCTG TGATGGTGGT AGTTTGTATG TGAATAAGCA TGCATTCCAC 

19190 19200 19210 19220 19230 19240 19250 

>< Tru9I 

> < Muni 

>< TthHB8I >< Msel 

>< Bcgl/a >< TaqI >< Dral 

>< Alul >< Bcgl 

ACTCCAGCTT TCGATAAAAG T G CAT T TACT AATTTAAAGC AATTGCCTTT CTTTTACTAT TCTGATAGTC 
19260 19270 19280 19290 19300 19310 19320 

>< pleI SfaNI >< 

>< Nlalll >< Ma en 

>< BsmAI BsaAI >< 

>< Hinflx Alw26I Afllll >< 

CTTGTGAGTC TCATGGCAAA CAAGTAGTGT CGGATAT TGA TTATGTTCCA CTCAAATCTG CTACGTGTAT 
19330 19340 19350 19360 19370 19380 19390 

Zsp2I > 
>< Seal 

PpulOI >< 
>< RsalNsil > 
Mphll03I > 
>< SfaNIEcoT22I > 
> < Rsal >< Csp6I 
>< Csp6I Avalll -X 

>< NlaIII> < Afal >< Afal 
TACACGATGC AATTTAGGTG GTGCTGTTTG CAGACACCAT GCAAATGAGT ACCGACAGTA CTTGGATGCA 
19400 19410 19420 19430 19440 19450 194,60 

>< Fokl 

TATAATATGA TGATTTCTGC TGGATTTAGC CTATGGATTT ACAAACAATT TGA TACT TAT AACCTGTGGA 
19470 19480 19490 19500 19510 19520 19530 

>< ScrFI 

X'Mval 
>< Maelll 
>< EcoRII 

>< Ecll36I 
>< DsaV 

>< BstOI 

>< BstNI 

X BsiLI >< Tru9I 

>< Apyl >< MseI 

AT AC AT T TAC CAGGTTACAG AG T T TAG AAA ATGTGGCTTA TAATGTTGTT AATAAAGGAC ACTTTGATGG 
19540 19550 19560 19570 19580 19590 19600 

X SgrAI 
X Nael 

X Mspl > < Vspl 

>< Hpall > < Tru9I 

X HapII > < Msel 

x CfrlOI > < Asnl 

>< BspWI > < Asel 
ACACGCCGGC GAAGCACCTG TTTCCATCAT TAATAATGCT GTTTACACAA AGGTAGATGG TATTGATGTG 

19610 19620 19630 19640 19650 19660 19670 

FIGURE 13. 45 



1er depot 



59/83 

>< XhoII 
>< Sau3AI 
X Ndell 
>< Mfll 
>< Mbol 
>< DpnII 

>K °P nI >< Maelll 

. >< BstYI >< EspI 

>< BspAI >< DdeITru9I X 

>< Bspl43I >< Tru9I >< CelllMsel >< 

>< Bglll >< Msel >< Alul >< Bpull02I 

GAGATCTTTG AAAATAAGAC AACAC TTC CT GTTAATGTTG CATTTGAGCT TTGGGCTAAG CGTAACATTA 
19680 19690 19700 19710 19720 19730 19740 

>< Fnu4HI 

>< Tru9I >< EcoRV 

>< BsrI >< Msel >< Bbvl >< Eco32I 

AACCAGTGCC AG AG AT T AAG ATACTCAATA ATTTGGGTGT TGATATCGCT GCTAATACTG TAATCTGGGA 
19750 19760 19770 19780 19790 19800 19810 

>< Nspl 
>< NspHI 
>< Nlalll 
>< Bsgl 
>< Afllll 

CTACAAAAGA GAAGCCCCAG CACATGTATC TACAATAGGT GTCTGCACAA TGACTGACAT T GCC AAGAAA 
19820 19830 19840 19850 19860 19870 19880 

>< DdelX MboII >< AccI 

CCTACTGAGA GTGCTTGTTC TTCACTTACT GTCTTGTTTG ATGGTAGAGT GGAAGGACAG GTAGACCTTT 
19890 19900 19910 19920 19930 19940 19950 



X Tru9I 
>< Msel 



SinI X 
Sau96I x 
NspIV X 
NspHII X 
NlalV X 
Eco47I X 
Cfrl3I x 

X BslI 
BsiZI x 

X BsiYI 
BscBI X 
Bmel8I x 
Avail X 
Asul X 



TTAGAAACGC CCGTAATGGT GTTTTAATAA CAGAAGGTTC AGTCAAAGGT CTAACACCTT CAAAGGGACC 
19960 19970 19980 19990 20000 20010 20020 

X Vspl 
x Tru9l 
x Plel 
x Msel 
x Maelll 

X Asnl X Tfil 
X HinfIX Asel X Hinfl 



>< Rmal 
x Nhel 
X Mael 
x Hgalx Alul 



Tru9I X 
X Tru9I 

Msel X 
X Msel 



AGCACAAGCT AGCGTCAATG GAGTCACATT AATTGGAGAA TCAGTAAAAA CACAGTTTAA CTACTTTAAG 
20030 20040 20050 20060 20070 20080 20090 



>< Ddel >< Mnll Tru9I >< 
>< BsmAI >< Ddel 



I 
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>K AccI >< Alw26I >< BfrlMsel >< 

AAAGTAGACG GCATTATTCA ACAGTTGCCT GAAACCTACT TTACTCAGAG CAGAGACTTA GAGGATTTTA 
20100 20110 20120 20130 20140 20150 20160 



>< Xcml 
X Sau3AI 
>< Ndell 
>< Mbol 
>< DpnII 

>< Dpnl 
>< BspAI 

>< Bspl43I 
AGCCCAGATC ACAAATGGAA 
20170 20180 



>< TthliB8I 
>< TaqI 

>< SstI 

>< Sdul 

>< SacI 

> < PaeR7I 

> < NspIII 

>< NspII 
>< HgiAI 

> < Eco88I 

> < XhoIX Eco24I 

>< Ecll36II 

> < SlalX Bspl286I 

> < CcrIX Bmyl 

> < BcoIX Banll 

> < Ama87I 

> < Avalx Alw21X 

X Alul >< 
ACTGACTTTC TCGAGCTCGC TATGGATGAA 
20190 20200 20210 



Xhol X 
TthHB8I > 
TaqI > 
Slal X 
PaeR7I X 
NspIII >< 
x Mnll 
Eco88I >< 
Ccrl >< 
BspWI >< 

Bcol X 
> < Bcgl/a 

Aval X 
Ama87I X 
EcoRI X FoklAluI >< 
TTCATACAGC GATATAAGCT 
20220 20230 



X TthHB8I 
X TaqI 
X Sful 
X NspV 
X Lspl 

>< Csp45I 'I 
X BstBI ; 
X Bspll9I 

X BsiCI >< Mbol I 

X Bpul4I >< BbsI Tru9I X 

X AsuII X Bcgl >< Nlalll >< AcilMsel X 

CGAGGGCTAT GCCTTCGAAC ACATCGTTTA TGGAGATTTC AGTCAT GGAC AACTTGGCGG TCTTCATTTA 
20240 20250 20260 20270 20280 20290 20300 

X HphI 
X HinPlI 
X Hin6I 
X Espl > < Hhal X Tfil 

X Ddel >< HaeXI 

>< Celll X Eco47III 
>< Bpull02I > < Cfol >< Hinfl 
X Bfrl >< Bspl43II 



>< Tru9I 
X Msel 
X Mnll 



^-s, DJLJ-JL ^ ^ ^^JC* * w — 

ATGATAGGCT TAGCCAAGCG CT C ACAAG AT TCACCACTTA AATTAGAGGA TTTTATCCCT ATGGACAGCA 



20310 



20320 



X SfaNI 



20330 

X MstI 
X HinPlI 
>< Hin6I 
>< Hhal 
X Fspl 
X Fdill 
x Cfol 
X Avill 



20340 



20350 



20360 



20370 



Sau3AI X 
Ndell X 
Mbol X 
DpnII >< 

Dpnl >< 
BspAI >< 
Bspl4 3I >< 



CAGT GAAAAA TTACTTCATA ACAGATGCGC AAACAGGTTC ATCAAAATGT GTGTGTTCTG TGATTGATCT 
20380 20390 20400 20410 20420 20430 20440 



X TthHB8I 



FIGURE 13.47 
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>< Tthllll 
>< TaqI 

>< Aspl > < Maelll Maelll >< 

TTTACTTGAT GACTTTGTCG AGATAATAAA GTCACAAGAT TTGTCAGTGA TTTCAAAAGT GGTCAAGGTT 
20450 20460 20470 20480 20490 2Q500 20510 



>< Nspl 
>< NspHI 
>< Nlalll 
>< Fokl 

>< Mu ^I > < Nlalll >< AflHI 

ACAATTGACT ATGCTGAAAT TTCATTCATG CTTTGGTGTA AGGATGGACA TGTTGAAACC TTCTACCCAA 



20520 



20530 



20540 



20550 



20560 



20570 



20580 



>< SfaNI 

>< ScrFI 

>< Mval 
>< EcoRII 

>< Ecll36I 
>< DsaV 

>< BstOI 

>< BstNI 

>< BsiLI 

>< BspWI X Apyl . . _ „ ov ^ x ^ 

AACTACAAGC AAGTCAAGCG TGGCAACCAG GTGTTGCGAT GCCTAACTTG TACAAGATGC AAAGAATGCT 
20590 20600 20610 20620 20630 20640 20650 



>< SfaNI 

X Rsal 
> < Csp6l 
X Afal 



BspWI >< 

BsmI 
BscCI X 



X Eco57I X Maelll >< H phl 

TCTTGAAAAG TGTGACCTTC AGAATTATGG TGAAAATGCT GTTATACCAA AAGGAATAAT GATGAATGTC 
20660 20670 20680 20690 20700 20710 20720 

> < Rsal 
>< Csp6I 

X Bstll07I >< T3ru9I >< Alul 

>< AccI >< Msel > < AfalNlalll x 

GCAAAGTATA CTCAACTGTG TCAAT ACT T A AATACACTTA CTTTAGCTGT ACCCTACAAC ATGAGAGTTA 
20730 20740 20750 20760 20770 20780 20790 

X ScrFI 

x Rsal 
>< Mval 
X EcoRII >< NspBII 

X Ecll36I >< Sdul 

> < Csp6I >< NspII 

X BstOI >< Pvullx HgiAI 
X BstNI >< Ddel 

>< BsiLI X PspSlX Bspl28 6l 
x Apyl X Alul X Bmyl 
>< DsaVX Afal >< Alw21I 

TTCACTTTGG TGCTGGCTCT GATAAAGGAG TTGCACCAGG TACAGCTGTG CTCAGACAAT GGTTGCCAAC 
20800 20810 20820 20830 20840 20850 20860 

X XhoII 

X Tru9I 
>< Sau3AI 
>< Ndell 
X TthHB8I x Msel 
>< Mfll 
X Mbol 
>< MamI 
>< DpnII 
>< Tfil X Dpnl 



ET^T mc 10 AO 
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>< BstYI > < TfiI 

>< BspAI > < Hinf I 

>< HinfIX Bspl43I >< Esp3I 

>< BsiBI >< Tthllll >< BsmBI 

>< BsaBI >< BsmAI > 

>< BsrI >< TaqI >< Bglll >< Aspl >< Alw26I >< Hgal> 

TGGCACACTA CTTGTCGATT CAGATCTTAA TGACTTCGTC TCCGACGCAG ATTCTACTTT AATTGGAGAC 

20870 20880 20890 20900 20910 20920 20930 



>< Tru9I 
X Msel 

< BsmAI 

< Alw26I 



>< Rsal 
> < Csp6I 
>< Afal 



< SinI 

< Sau96I 

>< PssI 
>< PspSII 

< PpuMI 

< NspIV 
>< NspHII 
>< NlalV 

< Eco0109I 

< Eco47I 

< Drall 

< Cfrl3I 

< BsiZI 
>< BscBI 

< Bmel8I 

< Avail 

< Asul 



TGTGCAACAG TACATACGGC TAATAAATGG GACCTTATTA 
20940 20950 20960 20970 



>< Styl 

>< SinI 
>< Sau96I 
>< Ritial 

>< NspIV 
NspHII >< 
>< Mael 

>< EcoT14I 

>< Eco47I 

>< Ecol30I 

>< Cfrl3I 

X BssTlI 

X BsiZI 

>< BsaJI 

>< Bmel8I 

>< Blnl 

>< Avrll 

X Avail 
X Asul 
AflHI •<>< 

TTAGCGATAT GTATGACCCT AGGACCAAAC 
20980 20990 21000 



X Nspl 
X NspHI 

X Nlalll X Plel R™ 31 >< 

>< Maelll x Hinf I Mael >< 

ATGTGACAAA AGAGAATGAC TCTAAAGAAG GGTTTTTCAC TTATCTGTGT GG AT T TAT AA AGCAAAAACT 

21010 21020 21030 21040 21050 21060 21070 



>< ScrFI 

X Mval 
X EcoRII 

X Ecll36I 
X DsaV 

X BstOI Sau96I > 

X BstNI NspIV > 

X BsiLI Cfrl3I > 

X BsaJI BsiZI > 

X BsaJI >< Sfcl >< BsmI >< BsmI Asul > 

X Apyl > < Alul >< BscCI X BscCIHincIIII ><>< Alul 

AGCCCTGGGT GGTTCTATAG CTGTAAAGAT AACAGAGCAT TCTTGGAATG CTGACCTTTA CAAGCTTATG 
21080 21090 21100 21110 21120 21130 21140 

X Zsp2I 
>< PpulOI 

X Pall >< NsiI 

x Haelll >< MphllOSI 

x BsuRI ><c Maelll X EcoT22I 

X BshI >< Nlallix Alul >< Bcgl X Avalll X SfaNIBcgl/a X 

GGCCATTTCT CATGGTGGAC AGCTTTTGTT ACAAAT GTAA ATGCATCATC ATCGGAAGCA TTTTTAATTG 
21150 21160 21170 21180 21190 21200 21210 



Tru9I x 

X Msel 



FIGURE 13.4 9 
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>< Zsp2I 
>< SphI 
>< PpulOI 

>< Pael 
>< Nspl 
>< NspHI 

>< Nsil 

>< Nlalll 

> < Nlalll 

>< Mphll03I 
>< EcoT22I 

> < Avalll >< Mnll 
GGGCTAACTA TCTTGGCAAG CCGAAGGAAC AAATTGATGG CTATACCATG CATGCTAACT ACATTTTCTG 

21220 21230 21240 21250 21260 21270 21280 

Tru9I >< 

>< MboII >< Tru9I 

>< Gsul Msel >< 

>< BsrI >< Msel 

>< Bpml Mnll >< 

>< Bbsl >< Nlalll X Mnll 

GAGGAACACA AATCCTATCC AGTTGTCTTC CTATTCACTC TTTGACATGA GCAAATTTCC TCTTAAATTA 
21290 21300 21310 21320 21330 21340 21350 

>< Tru9l 
>< Msel 
>< Esp4I> < Tfil 

. >< BsmAI Ksp632I >< 

>< Alw26I >< MboII >< Earl 

>< AflII> < Hinfl Eamll04I >< 

AGAGGAACTG CTGTAATGTC TCTTAAGGAG AATCAAATCA AT GATATGAT TTATTCTCTT CTGGAAAAAG 
21360 21370 21380 21390 21400 21410 21420 

>< Tru9I 
>< Msel 
X Hindll 
>< Hindi 
>< Hpal Afllll > 

GTAGGCTTAT CATTAGAGAA AACAACAGAG TTGTGGTTTC AAGTGATATT CTTGTTAACA ACTAAACGAA 
21430 21440 21450 21460 21470 21480 21490 

>< Vnel 
>< Snol 

>< Sdul 
>< NspII 
>< Hpal I 

>< HgiAI 
X HapII 
>< CfrlOI 

X Bspl286I 
>< MspIX Bmyl 

>< Nspl X Spel X ApaLI 

X NspHI X Rmal >< Alw4 4I 

X Nlalll X Mael x Maelll >< Agel >< Alw21I 

CATGTTTATT TTCTTATTAT TTCTTACTCT CACTAGTGGT AGTGACCTTG ACCGGTGCAC CACTTTTGAT 
21500 21510 21520 21530 21540 21550 21560 

> < Alul X Mnll 

GATGTTCAAG CTCCTAATTA CACTCAACAT ACTTCATCTA TGAGGGGGGT TTACTATCCT GATGAAATTT 
21570 21580 21590 21600 . 21610 21620- 21630 

x Sau3AI 



T-»-r <^it rr\ t-» <* <-» C f\ 
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>< Ndell 
>< Mbol 
>< DpnII 

>< Dpnl >< Tru9I 

>< BspAI >< Msel > < MboII 

>< Bspl43I >< Ddel >< Maelll 

TTAGATCAGA CACTCTTTAT TTAACTCAGG ATTTATTTCT TCCATTTTAT TCTAATGTTA CAGGGTTTCA 
21640 21650 21660 21670 21680 21690 21700 

>< Vspl 
>< Tru9I 
>< Msel 

X Asnl >< Tru9I X Fokl 

>< Asel >< Maell >< Msel >< Bbvl > < Fnu4HI 

TACTATTAAT CATACGTTTG GCAACCCTGT CATACCTTTT AAGGATGGTA TTTATTTTGC TGCCACAGAG 
21710 21720 21730 21740 21750 21760 21770 

>< BslI 

>< Dsalx BsiYI >< Nlalll 

>< BsaJI > < Maelll 

AAATCAAATG TTGTCCGTGG TTGGGTTTTT GGTTCTACCA TGAACAACAA GTCACAGTCG GTGATTATTA 

21780 21790 21800 21810 21820 21830 21840 

>< Nspl 

>< Tru9I X NspHI 

>< Msel >< Nlalll 

>< HphI >< Maelll >< Maelll 

TTAACAATTC TACTAATGTT GT TAT AC GAG CATGTAACTT TGAATTGTGT GACAACCCTT TCTTTGCTGT 
21850 21860 21870 21880 21890 21900 21910 

>< Styl >< Zsp2I ^ 

>< Nlalll >< Tru9I ? 

>< Ncol >< Rsal >< PpulOI TthHB8I >< 

>< EcoT14I >< Nsil X TaqI , 

>< Ecol30I >< Msel SfaNI >< 

>< Dsalx Csp6I >< Mphll03I Rsal >< 

X BssTlI >< TthHB8I >< EcoT22I Csp6I X 

>< BsaJlx Afal X TaqI >< Avalll Afal >< 

TTCTAAACCC ATGGGTACAC AGACACATAC TATGATATTC GATAATGCAT TTAATTGCAC TTTCGAGTAC 

21920 21930 21940 21950 21960 21970 21980 

>< Tru9I 
>< Msel 
X Dral 

ATATCTGATG CCTTTTCGCT TGATGTTTCA G AAAAG T C AG GTAATTTTAA ACACTTACGA GAGTTTGTGT 
21990 22000 22010 22020 22030 22040 22050 

X Sau3AI 
>< Ndell 
>< Mbol 
x DpnII 

>< Tru9I >< Dpnl 

>< Msel >< BspAI 

X Dral >< Sfcl Bspl4 3I X 

T T AAAAAT AA AGATGGGTTT CTCTATGTTT ATAAGGGCTA TCAACCTATA GATGTAGTTC GTGATCTACC 
22060 22070 22080 22090 22100 22110 22120 

X Tru9I 

x Tru9l > < Tru9I >< Msel 

x Msel > < Msel >< Mnll 

TTCTGGTTTT AACACTTTGA AACCTATTTT TAAGTTGCCT CTTGGTATTA ACATTACAAA TTTTAGAGCC 
22130 22140 22150 22160 22170 22180 22190 

FIGURE 13.51 
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> < SdulX Sfcl 

>< PvuII 
>< PspSI 

> < NspII 

>< NspBII 

> < Maell > < Fnu4HI 

> < Bspl28 6l >< PstI Tru9I > 
>< BspMI > < BmylX Fnu4HI Msel > 

PhI >< 3bvl >< Alul >< RhvT 

ATTCTTACAG CCTTTTCACC TGCTCAAGAC ATTTGGGGCA CGTCAGCTGC AGCCTATTTT GTTG6CTATT 
22200 22210 22220 22230 22240 22250 22260 

>< SfaNI 
>< Rsal 

^ r> ^ > < Csp6I 

TAAAGCCA^C TACATTTATG CTCAAGTATG ATGAAAATGG Xc^ACA GATGCT^Jg'aTTGTTCTCA 
22270 22280 22290 22300 22310 22320 22330 

> < Tru9I 

> < Msel 

>< Alul 

AAATCCACTT GCTGAACTCA AATGCTCTGT TAAGAGCTTT GAGATTGACA AAGGAATTTA CCAGACCTCT 
22340 22350 22360 22370 22380 22390 22400 

>< Saul 
>< Mstll 
>< Eco81I 
>< Ddel 
>< Cvnl 
>< Bsu36I 
>< Bse21I 

>< Axyl >< xfil 

><: Mnl1 A ° Cl ><C Mnl1 >< Hin " >< Sspl >< Mnir 

AATTTCAGGG TTGTTCCCTC AGGAGAT GTT GTGAGATTCC CTAATATTaS AAACTTGTGT cStESaG 
22410 22420 22430 22440 22450 22460 22470 

>< 2sp2I 
X PpulOI 

X Nsil 

> < Nlalll 
X Mphll03I 

>< Tru9I ><c EcoT22I 

>K Mser X Avalll 

AGGTTTTTAA TGCTACTAAA TTCCCTTCTG TCTATGCATG GGAGAGAAAA AAAAT TTCTA ATTGTGTTGC 
22480 22490 22500 22510 22520 22530 22540 

x Sdul 
X NspII 
X HgiAI 
X Bspl286l 

X Bmyl >< Tru 9x 

X Alw21I >< MseI 

TGATTACTCT GTGCTCTACA ACTCAACAT T TTTTTCAACC TTTAAGTGCT ATGGCGTTTC TGCCACTAAG 
22550 22560 22570 22580 22590 22600 22610 

X Sau3AI 
X Ndell 
x.Mbol 
X DpnII 
X Dpnl 
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>< BspAI X Tfil 

X Bspl43I X Hinfl 

TTGAATGATC TTTGCTTCTC CAATGTCTAT GCAGATTCTT TTGTAGTCAA GGGAGATGAT GTAAGACAAA 
22620 22630 22640 22650 22660 22670 22680 



>< ScrFI 
>< Mval 
>< HinPlI 
>< Hin6I 
>< Hhal 

>< Haell 
>< EcoRII 

X EC1136I 
>< DsaV 
>< Cfol 
>< BstOI 
X BstNI 
X Bspl43II 
X BsiLI 

X Apyl > < BsrI >< Nlalll 

TAGCGCCAGG ACAAACTGGT GTTATTGCTG ATTATAATTA TAAATTGCCA GATGATTTCA TGGGTTGTGT 
22690 22700 22710 22720 22730 22740 22750 



X SfaNI 
x Rmal 
X Mael 

CCTTGCTTGG AATACTAGGA ACATTGATGC TACTTCAACT 
22760 22770 22780 22790 



Ddel X. 

X BsrI Bfrl X 

GGTAATTATA AT T AT AAAT A TAGGTATCTT 
22800 22810 22820 



>< Sau96I 

X Pall 
X NspIV 
> < Hindlll 

X Haelll 
X EcoO109I 
X Drall 
X Ddel 

X Cfrl3I 
x BsuRI 
X BsiZI 
X BshI 
X Bfrl >< PssI 
>< Nlalll >< AsuIX BsmAI 

X Alul X Alw26I BspWI X 

AGACATGGCA AGCTTAGGCC CTTTGAGAGA GACATATCTA ATGTGCCTTT CTCCCCTGAT GGCAAACCTT 
22830 22840 22850 22860 22870 22880 22890 

X Tru9I 
X Pall 
X MscI 
>< Haelll 
>< Eaeix Msel 
X Tru9I >< BsuRI 

X Msel X BshI 

X BspMI x Ball BsrI X 

GCACCCCACC TGCTCTTAAT TGTTATTGGC CATTAAAT GA TTATGGTTTT TACACCACTA CTGGCATTGG 
22900 22910 22920 22930 22940 22950 22960 



Sau96I X 
x PallNspIV X 
> < Mspl NspHII X 
X Haelll 



FIGURE 13.53 
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> < Hpall Eco47I >< 

>< Dsal 

> < HapII Cfrl3I >< 

>< BsuRISinI >< 
>< Gdill BsiZI X 
>< Seal >< BsaJI 

>< Rsal >< Tru9I >< Eael Bmel8I >< 

>< Csp6I >< Msel >< CfrlOI Avail >< 

>< Afal >< Dral >< BshI Asul >< 

CTACCAACCT TACAGAGTTG TAGTACTTTC TTTTGAACTT TTAAATGCAC CGGCCACGGT TTGTGGACCA 
22970 22980 22990 23000 23010 23020 23030 

>< Tru9I >< Rsal 

>< Tru9I >< Csp6l 

>< Plel BsrI >< 

> < Tru9I >< Msel >< BsrI 

> < Mselx BsrI >< Msel >< Hinfl >< Afal 
AAATTATCCA CTGACCTTAT TAAGAACCAG TGTGTCAATT TTAATTTTAA TGGACTCACT GGTACTGGTG 

23040 23050 23060 23070 23080 23090 23100 

>< Tru9l >< PalI 

>< MseI >< Haelll 

>< MboII >< Gdill 

x Hpal >< EaeI 

X Hindll - >< BsuRI Tfil X 

>< Hindi >< BshI Hinfl x 
TGTTAACTCC TTCTTCAAAG AGATT TCAAC CATTTCAACA ATTTGGCCGT GATGTTTCTG ATTTCACTGA 

23110 23120 23130 23140 23150 23160 23170 

> < Xholl 
X TthHB8I 
X TaqI 

> < Sau3AI 

> < Ndell 

> < Mfll 

> < Mbol 

> < DpnII 

>< Dpnl 

> < BstYI 

> < BspAI > < Sspl 

>< Alwl X Bspl43I x HphI 

TTCCGTTCGA GATCCTAAAA CATCTGAAAT ATTAGACATT TCACCTTGCT CTTTTGGGGG TGTAAGTGTA 
23180 23190 23200 23210 23220 23230 23240 

>< ScrFI 
>< Mval 
>< EcoRII 

>< Ecll36I >< Tru9 i 

>< °saV >< MseI 

X BstOI >< HpaI 

X BstNI >< HindII 

X BsiLI >< Eco57I 

>< Apyl >< Bsgl >< Hindi 

ATTACACCTG GAACAAATGC TTCATCTGAA GTTGCTGTTC TATATCAAGA TGTTAACTGC ACTGATGTTT 
23250 23260 23270 23280 23290 23300 23310 

>< Sau3AI 
X Nlalll 
X Ndell 

>< Mbol ' • • • 

>< DpnII 

>< Dpnl >< HinPlI 
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>< BspWI >< Hin6I 

>< BspAI > < Hhal Plel >< 

>< Sfcl >< Bspl4 3I >< Alul> < Cfol >< BsrI 

CTACAGCAAT TCATGCAGAT CAACTCACAC CAGCTTGGCG CATATATTCT ACTGGAAACA ATGTATTCCA 
23320 23330 23340 23350 23360 23370 23380 

>< TthHB8I 
>< TaqI 
X Sail 
>< Rtrl 
>< Nspl 
X Espl >< NspHI 
>< Ddel >< Nlalll 
>< Celll >< Hindll 
>< Bpull02I>< Hindi 
>< Hinfl >< Alul >< Accl 

GACT CAAGCA GGCTGTCTTA TAGGAGCTGA GCATGTCGAC ACTTCTTATG AGTGCGACAT TCCTATTGGA 
23390 23400 23410 23420 23430 23440 23450 

> < SnaBI 

>< Seal 
>< Rsal 
>< Rmal 
>< Maell >< Mael 

> < EcolOSI 
>< Rmal >< Csp6I 

>< Maelll > < BsaAI 

>< Alul. >< Mael >< Afal f 

GCTGGCATTT GTGCTAGTTA CCATACAGTT TCTTTATTAC G TAG TACT AG CCAAAAATCT ATTGTGGCTT 
23460 23470 23480 23490 23500 23510 23520 

>< Muni 

ATACTATGTC TTTAGGTGCT GATAGTTCAA TTGCTTACTC TAATAACACC AT TGCTAT AC CTACTAACT.T 
23530 23540 23550 23560 23570 23580 2359,6 

Rsal >< 
>< Mnll 

Csp6I >< 

X Sfcl Afal >< 

TTCAATTAGC ATTACTACAG AAGTAATGCC TGTTTCTATG GCTAAAACCT CCGTAGATTG TAATATGTAC 
23600 23610 23620 23630 23640 23650 23660 

> < Tfil 

> < Hinfl 

>< Acil > < Alul 

ATCTGCGGAG ATTCTACTGA ATGTGCTAAT TTGCTTCTCC AATATGGTAG CTTTTGCACA C AAC TAAATC 
23670 23680 23690 23700 23710 23720 23730 

>< Vnel 

X Sdul 
X NspII 

X HgiAI >< Pmll 

X Snoix Ddel >< Sau3AI x PraaCI 

X Bspl286I >< Ndell >< Maell 

X Bmyl >< Mbol >< Eco72l 

X Bbvl >< Dpnl X BsaAI 

>< ApaLI >< Bspl43I X BbrPI 

>< Alw44I >< DpnII X Alwl 

X Alw21I X Fnu4HI >< BspAI >< Afllll 
GTGCACTCTC AGGTATTGCT GCTGAACAGG ATCGCAACAC ACGTGAAGTG TTCGCTCAAG T CAAAC AAAT 

23740 23750 23760 23770 23780 23790 23800 
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>< Rsal 

>< Csp6I >< Tru9I 

>K AfaI >< Sspl >< Msel >< Sspl 

GTACAAAACC CCAACTTTGA AATATTTTGG TGGTTTTAAT TTTTCACAAA TATTACCTGA CCCTCTAAAG 
23810 23820 23830 23840. 23850 23860 23870 

>< Mnll 

><: MniI >< Tru9I >< SfaNI >< HphI Nlalll >< 

>< Ddel >< Mnll >< Msel >< Maelll BspHI >< 

CCAACTAAGA GGTCTTTTAT TGAGGACTTG CTCTTTAATA AGGTGACACT CGCTGATGCT GGCTTCATGA 
23880 23890 23900 23910 23920 23930 23940 



>< 









X XhoII 










>< Sau3AI 




>< Styl 




X 


Rmal 




>< Rraal 






>< Ndell 




>< Mael 






x Mfll 




>< EcoT14I 






X Mbol 


X MstI 


>< Ecol30I 




X 


Mael 


X HinPlI 


>< BssTlI 


X 


Vspl 


>< Dpnl I 


X Hin6I 


>< BsmI 




X Hphl> < Dpnl 


X Hhal 


BscCI 


X 


Tru9I 


>< BstYI 


X Fspl 


X BsaJI 


X 


Msel 


X BspAI 


X Fdill 


>< Blnl 


X 


Asnl 


> < Bspl43I 


X Cfol 


X Avrll 


X 


Asel 


X Bglll 


X Aviir 



23950 



23960 



23970 



23980 



23990 



24000 



24010 



>< RmalRsal x 
>< Mnll x Fnu4HI >< Fnu4HI Csp6I X 

X BspWI >< Bbvl >< Bbvl x BspWI x MaelAfal X 

TACAGTGTTG CCACCTCTGC TCACTGATGA TATGATTGCT GCCTACACTG CTGCTCTAGT TAGTGGTACT 
24020 24030 24040 24050 24060 24070 24080 

x MboII 
X HinPlI 
X Hin6I 
x Hhal 
X Haell 

X Fnu4HI X Ksp632I 
>< Cfol >< Earl 
X BspWI x Eamll04I 
X Bspl43II 

GCCACTGCTG GATGGACATT TGGTGCTGGC GCTGCTCTTC AAATACCTTT TGCTATGCAA ATGGCATATA 
24090 24100 24110 24120 24130 24140 24150 



>< Fokl 
X Bbvl 



Tru9I x 

>K Msel X 

GGTTCAATGG CATTGGAGTT ACCCAAAATG TTCTCTATGA GAACCAAAAA CAAATCGCCA ACCAATTTAA 
24160 24170 24180 24190 24200 24210 24220 



Maell x 

><: TfiI X Fnu4HI 

X Hinfl >< Bbvl x Alul 

CAAGGCGATT AGTCAAATTC AAGAATCACT TACAACAACA TCAACTGCAT TGGGCAAGCT GCAAGACGTT 
24230 24240 24250 24260 24270 24280 24290 



X Tru9I 
X Msel 
>< Hpal 

X Hindll X BsmI X Tru9I 
X Hincllx BscCI x Msel 



X Ddel 
>< Tru9I >< Bfrl 
X Msel x Alul 



FTHTTPP 1^ 
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GTTAACCAGA ATGCTCAAGC ATTAAACACA CTTGTTAAAC AACTTAGCTC TAATTTTGGT GCAATTTCAA 
24300 24310 24320 24330 24340 24350 24360 

>< Thai 

>< Spol 

>< Nrul 

X Mvnl 

>< BstUI >< TthHB8I 

>< Bsp68I >< TaqI >< Rsal 

>< BspSOI >< Mnll >< Csp6I 



>< EcoRV 



>< Tru9I 

>< Eco32I >< AccII >< Mnll >< AcilX Afal >< Msel 

GTGTGCTAAA TGATATCCTT TCGCGACTTG ATAAAGTCGA GGCGGAGGTA CAAATTGACA GGTTAATTAC 
24370 24380 24390 24400 24410 24420 24430 

>< Maelll >< Bbvl >< Fnu4HI Bbvl >< 

AGGCAGACTT CAAAGCCTTC AAACCTATGT AACACAACAA CTAATCAGGG CTGCTGAAAT CAGGGCTTCT 
24440 24450 24460 24470 24480 24490 24500 

>< Fnu4HI >< Hindll 

>< BspWI >< Ddel >< Hindi 

GCTAATCTTG CTGCTACTAA AATGTCTGAG TGTGTTCTTG GACAATCAAA AAGAGTTGAC TTTTGTGGAA 
24510 24520 24530 24540 24550 24560 24570 

> < Nspl 

> < NspHI 

> < Nlalll 
>< Maelll 

>< Nlalll >< Maell 

>< MboII >< Fokl 

X Fnu4HI >< Bbsl BsaAI >< 

>< AcilX Bbvl >< AflHI : : , 

AGGGCTACCA CCTTATGTCC TTCCCACAAG CAGCCCCGCA TGGTGTTGTC TTCCTACATG TCACGTATGT 
24580 24590 24600 24610 24620 24630 24640 

>< ScrFI 
>< Mval 
>< EcoRII 
>< EC1136I 
>< BstOI 
>< BstNI 
>< Mnll >< BslI 
X DsaVX BsiYI 

>< BsiLI 
X BsaJIX HphI 
X Apyl 



X 
X 



HinPlI 
Hin6I 
X Hhal 

X Haell 
X Cfol X Nlalll 

X Bspl4 3II X BspHI EcoNI X 

GCCATCCCAG GAGAGGAACT TCACCACAGC GCCAGCAATT TGTCATGAAG GC AAAG CAT A CTTCCCTCGT 
24650 24660 24670 24680 24690 24700 24710 

X Mnll 
X BslI x Tru9I 

>< BsiYI X Msel X Mnll 

GAAGGTGTTT TTGTGTTTAA TGGCACTTCT TGGTTTATTA CACAGAGGAA CTTCTTTTCT CCACAAATAA 
24720 24730 24740 24750 24760 24770 24780 

x Ddel >< Tru9I 

X BsmAI >< SfaNI 

X Sfcl X Alw26l x MselAlwI x 

TTACTACAGA CAATACATTT GTCTCAGGAA ATTGTGATGT CGTTATTGGC ATCATTAACA ACACAGTTTA 
24790 24800 24810 24820 24830 24840 24850 



>< Sau3AI 
>< Ndell 
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>< Mbol >< Plel > < Seal 

>< DpnII >< Mnll > < Ksp632I > < Rsal 

>< Dpnl >< Ddel >< Hinfl >< MboII 

>< BspAI >< BspWI > < Eamll04I X Csp6I 

>< Bspl4 3I X Alul > < Earl > < Alul > < Afal > < HphI 

TGATCCTCTG CAACCTGAGC TTGACTCATT CAAAGAAGAG CTGGACAAGT ACTTCAAAAA TCATACATCA 

24860 24870 24880 24890 24900 24910 24920 

>< Sau3AI 
>< Ndell 
>< Mbol 
>< MamI 
>< DpnII 

>< Dpnl 
>< BspAI 

X Bspl43I 

>< BsiBI >< Tru9I >< Hindu 

X BsaBI >< Msel >< Hindi Acil >< 

CCAGATGTTG ATCTTGGCGA CATTTCAGGC ATTAACGCTT CTGTCGTCAA CAT TC AAAAA GAAATTGACC 
24930 24940 24950 24960 24970 24980 24990 

X Tru9I 

> < Tfil. 
>< Mnll >< Swal 

>< EcoNI >< Msel 

>< BslI > < Hinfl 

>< MnllX BsiYI >< Dral 

GCCTCAATGA GGTCGCTAAA AATTTAAATG AATCACTCAT TGACCTTCAA GAATT GGGAA AATATGAGCA 
25000 25010 25020 25030 25040 25050 25060 

>< Styl 
X Pall 
x Haelll 

x EcoT14I 

>< Ecol30I 
X BsuRI 

X BssTlI Nlalll x 

>< Tru9lx BshI Maelll x 

>< Msel X BsaJI >< BstXI 

AT AT AT T AAA TGGCCTTGGT ATGTTTGGCT CGGCTTCATT GCTGGACTAA TTGCCATCGT CATGGTTACA 
25070 25080 25090 25100 25110 25120 25130 

> < SphI 

> < Pael 

X Spel > < Nspi 

> < Rmal > < NspHI 
>< Nlalll > < Nlalll 

> < Mael X Mnllx Bbvl Enu4HI X 
ATCTTGCTTT GTTGCATGAC TAGTTGTTGC AGTTGCCTCA AGGGTGCATG CTCTTGTGGT TCTTGCTGCA 

25140 25150 25160 25170 25180 25190 25200 

>< Fokl 
>< Ddel 

>< Mnll >< Plelx Hinfl x BsrI 

AGTTTGATGA GGATGACTCT GAGCCAGTTC TCAAGGGTGT CAAATTACAT TACACATAAA CGAACTTATG 
25210 25220 25230 25240 25250 25260 25270 

>< Sau3AI 
x Ndell 
>< Mbol 
X DpnII 
> < Dpnl 
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>< BspAI 

> < Bspl4 3I 

>< Bsgl >< Alwl >< BsrI BspWI > 

GATTTGTTTA TGAGATTTTT TACTCTTGGA TCAATTACTG CACAGCCAGT AAAAATTGAC AATGCTTCTC 
25280 25290 25300 25310 25320 25330 25340 

>< Seal 
>< Rsal 
X Csp6I >< Sfcl 

>< Afal >< Nlalll >< Acil >< Mnll Fokl > 

CTGCAAGTAC TGTTCATGCT ACAGCAACGA TACCGCTACA AGCCTCACTC CCTTTCGGAT GGCTTGTTAT 
25350 25360 25370 25380 25390 25400 25410 



> < HinPlI 

> < Hin6I 

>< Hhal 

>< Haell >< HinPlI 

>< Eco47III >< Hin6I 

>< Cfol >< Hhal 

>< BspWI >< Bspl4 3II >< Cfol 
TGGCGTTGCA TTTCTTGCTG TTTTTCAGAG CGCTACCAAA ATAATTGCGC TCAATAAAAG AT G GCAGCT A 

25420 25430 25440 25450 25460 25470 25480 



Rmal >< 
Nhel >< 
Mael >< 
Fnu4HI >< 

Alul X 



>< EcoNI 
>< BslI 

>< BsiYI >< Maelll 

>< Bbvl >< BsrI >< Bbvl > < Fnu4HI Bbvl >< 

GCCCTTTATA AGGGCTTCCA GTTCATTTGC AATTTACTGC TGCTATTTGT TACCATCTAT TCACATCTTT 
25490 25500 25510 25520 25530 25540 2555^0 



Zsp2I >< 
PpulOI >< 

>< HinPlI Nsil >< 

>< Hin6I >< Rsal Mphll03I >< 

>< Hhal >< Csp6I EcoT22I X 

>< Cfol >< Afal >< Mnll Avalll X 

TGCTTGTCGC TGCAGGTATG GAGGCGCAAT TTTTGTACCT CTATGCCTTG ATATATTTTC TACAATGCAT 
25560 25570 25580 25590 25600 25610 25620 



> < Sfcl 

>< PstI 

> < Fnu4HI 
>< BspMI >< Mnll 



>< SfaNI 
>< Nspl 
>< NspHI 
>< Nlalll 

CAACGCATGT AGAATTATTA TGAGATGTTG GCTTTGTTGG 
25630 25640 25650 25660 



>< SfaNI 

AAGTGCAAAT CCAAGAACCC ATTACTTTAT 
25670 25680 25690 



X Bstll07I 
>< AccI Mael I I >< 

GATGCCAACT ACTTTGTTTG CTGGCACACA CATAACTATG ACTACTG TAT ACCATATAAC AGTGTCACAG 
25700 25710 25720 25730 25740 25750 25760 



>< MboII 

>< HphI BstXI >< 

>< Muni >< Maelll >< Maelll >< Eco57I >< Bbsl Mnll > 

ATACAATTGT CGTTACTGAA GGTGACGGCA TTTCAACACC AAAACTCAAA GAAGAC TACC AAATTGGTGG 
25770 25780 25790 25800 25810 25820 25830 



>< Rsal 

> < Nlalll 
>< HphI 
X Tru9I >< Tthlllix Csp6I 
>< Ddel >< Ddel >< Mseix Aspl >< Afal 
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TTATTCTGAG GATAGGCACT CAGGTGTTAA AGACTATGTC GTTGTACATG GCTATTTCAC CGAAGTTTAC 
25840 25850 25860 25870 25880 25890 25900 

Tru9I >< 

> < Hinfix Plel >< esrl Msel >< 

>< Alul >< AccI >< Sfcl X AlwNI >< MboII Hindlll > 

TACCAGCTTG AGTCTACACA AATTACTACA GACACTGGTA TTGAAAATGC TACATTCTTC ATCTTTAACA 
25910 25920 25930 25940 ,25950 25960 25970 

> < TthHB8I 

X Tru9I > < TaqI >< Ksp632I 

x Msel > < MboII x Earl BspWI X 

>K AluI >< Eco57I >< Eamll04I Alwl X 

AGCTTGTTAA AGACCCACCG AATGTGCAAA TACACACAAT CGACGGCTCT TCAGGAGTTG CTAATCCAGC 
25980 25990 26000 26010 26020 26030 26040 

X XhoII 
>< Sau3AI 

>< NlalV 
X* Ndell 
X Mfll 
>< Mbol 
X DpnII 

>< Dpnl 
X BstYI 
X BstI 
X BspAI 

It l sp li 31 >< 

>< BscBI >< Rroaj Csp6l >< 

>< BamHI >< Alwl >< Mae i Afal >< 

AATGGATCCA ATTTATGATG AGCCGACGAC GACTACTAGC GTGCCTTTGT AAGCACAAGA AAGTGAGTAC 
26050 26060 26070 26080 26090 26100 26110 

> < Tru9I 
>< Rsal 

> < Msel 
>< MboII 

> < RsaI >< Maell >< R S ai 

>< Csp6I >< Csp6I >< Tru9I >< Csp6I 

„„„„ > < AfaI >< Afal >< Msel >< Afal 

GAACTTATGT ACTCATTCGT TTCGGAAGAA ACAGGTACGT TAATAGTTAA TAGCGTACTT CTTTTTCTTG 
26120 26130 26140 26150 26160 26170 26180 

>< TthHB8I 
>< TaqI 

><: RraaI >< HinPlI > < RsaI 

> < Maelll >< Hin6I Fnu4HI >< 

>< Maei >< Rmal >< Hhal >< Csp6I 

>< Fokl X Maei >< cfol >< Bbvl > < Afal 

CTTTCGTGGT ATTCTTGCTA GTCACACTAG CCATCCTTAC TGCGCTTCGA TTGTGTGCGT ACTGCTGCAA 
26190 26200 26210 26220 26230 26240 26250 

>< Tru9I 

>< Tru9I >< ThaI 

>< Msel >< MvnI 

X Sspl X Maell >K Msel 

It u^tt >< BstUI Ksp632I > 

>< Hindll >< Maell >< Bsp50l >< MboII Earl > 

>< Hindi >< AccI >< AccII Eamll04T > 

TATTGTTAAC G TGAGTT TAG TAAAACCAAC GGTTTACGTC TACTCGCGTG TTAAAAATCT GAACTCTTCT 
26260 26270 26280 26290 26300 26310 ^25320 



FTGTTOF. 1U0 
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>< Sau3AI 
>< Ndell 
>< Mbol 
>< DpnII 
>< Mbol IX Dpnl 

>< XmnI >< BspAI> < Eco57I >< Tru9I 

>< Asp700I>< Bspl43I >< Msel 

GAAQGAGTTC CTGATCTTCT GGTCTAAACG AACTAACTAT T ATT AT TAT T CTGTTTGGAA CTTTAACATT 
26330 26340 26350 26360 26370 26380 26390 

>< ScrFI 
>< Mval 
>< EcoRII 

>< Ecll36I 
>< DsaV NlalV >< 
>< Rsal >< BstOI 

>< Mnll >< Tru9I >< BstNI Rmal >< 

>< Csp6I >< Msel >< BsiLI Mael X 

> < Nlalll >< Afal > < Alul >< ApylBscBI >< 

GCTTATCATG GCAGACAACG G TACT ATT AC CGTTGAGGAG CTTAAACAAC TCCTGGAACA . ATGGAACCTA 
26400 26410 26420 26430 26440 26450 26460 

>< ScrFI 
>< Rmal 

>< Mval 
>< Mael 

>< EcoRII 

>< Ecll36I 
>< DsaV 

>< BstOI ^ 
>< BstNI * 
>< BsiLI ; 
>< Apyl >< Mael I I 

GTAATAGGTT TCCTATTCCT AGCCTGGATT ATGTTACTAC AATTTGCCTA TTCTAATCGG AACAGGTTT?; 
26470 26480 26490 26500 26510 26520 26530' 

>< Pall 
>< Msel 
>< Mnll >< Maelll 
>< Haelll 
>< Eael 
X BsuRI 
>< BsrI 

X Rsal X BspWI 

X Csp6I X Hindlll ' >< BshI 

>< Afal X Alul >< Ball x Bbvl Fnu4HI >< 

TGTACATAAT AAAGCTTGTT TTCCTCTGGC TCTTGTGGCC AGTAACACTT GCTTGTTTTG TGCTTGCTGC 
26540 26550 26560 26570 26580 26590 26600 

>< Vspl 
>< Tru9I 

X Msel >< HphI 

x Sfcl x Asnl >< BsrI 

>< AccI >< Aseix Maellix Acil 
TGTCTACAGA ATTAATTGGG TGACTGGCGG GATTGCGATT GCAATGGCTT GTATTGTAGG CTTGATGTGG 
26610 26620 26630 26640 26650 26660 26670 

>< Espl 

X Eco57l 
>< Ddel 

>< Celll >< Rsal 

>< Bpull02I X Csp6I 

FIGURE 13. 61 
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>< Bfrl ' ^ _ - _, 

n.^ Tvi T >< Afal 

>< Alul x A * I 

CTTAGCTACT TCGTTGCTTC CTTCAGGCTG TTTGCTCGTA CCCGC?JaAT GTGGTCATTC AACCCAgLJ 
26680 26690 26700 26710 26720 26730 26740 

>< ScrFI 

>< Neil 
>< Mspl 
>< Hpall 
>< HapII 
X DsaVX Mnll 

X BslI 

X BsiYI 

X BsaJI >< Muni > < xcml 



X Sau3AI 
>< Ndell 
X Mbol 

X Fbal 
>< DpnII 

>< Dpnl 
>< BspAI 

>< Bspl4 3I 
>< BsiQI 
X Bell 



>< Maelll 



X Pall 
X Mspl 
>< Hpall 
>< HapII 
X Haelll 
X Gdill 
>< Eael 
>< BsuRI 
>< BshI 



> 
> 

>< 
>< 
>< 
>< 
>< 
>< 

CATTGGTGCT GTGATCATTC GTGGT^CTT *GCGAATGGCC°GGACACTCCC 
26820 26830 26840 26850 26860 

>< Sau3AI 
>< Ndell 
>< Mbol 
>< DpnII 
>< Dpnl 
X PssI >< BspMI 
>< PspSII >< BspAI 

X NspHII >< Bspl4 3l 

GACCTGCCAA AAGAGATCAC TGTGGCTACA 
26890 26900 26910 



Tru9I X 
SinI 
Sau96I 
PpuMI 
NspIV 
Msel >< 
X Maelll 

< Rmal >< Haell 

< Mael Ecc-01091 

>< HinPlIEco47l 
StylX Hin6I Drall 
EcoT14I Cfrl3I 
Ecol30I>< Bspl43II 
BssTlI BsiZI 
BsaJI Bmel8I 
Blnl >< Hhal Avail 
Avrll >< Cfol Asul 
TAGGGCGCTG TGAC AT TAAG 
26870 26880 



> 
> 
> 
> 

> 
> 
> 
> 



>< XmnI 

>< Asp700I > < Hgal Fnu4HI X 
TCACGAACGC TTTCTTATTA CAAATTAGGA GCGTCGCAGC 
26920 26930 26940 . 26950 



>< Tfil 
>< Hinfl 
>< Bbvl 
>< Bbvl >< Fnu4 

GTGTAGGCAC TGATTCAGGT TTTGCTGCAT 
26960 26970 26980 



X Mspl 
X Hpall 
X HapII 
X CfrlOI 
X Bcgl/a 



>< Sspl 



ut ^ * --r > < Tru9I 

HI x AcjlI > < MseI 

ACAACCGCTA CCGTATTGGA AACTATAAAT TAAATACAGA 

26990 27000 27010 27020 

>< Rsal 
>< Rmal 

X Csp6I 

^ ^Jlt r CgI Hind " >< 

x Afal x Maelll HincII >K 
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CCACGCCGGT AGCAACGACA ATATTGCTTT GCTAGTACAG TAAGTGACAA CAGATGTTTC ATCTTGTTGA 
27030 27040 27050 27060 27070 27080 27090 



>< ScrFI 

>< Mval 
>< Maelll 
>< EcoRII 

>< Ecll36I 
>< DsaV 

>< BstOI 

X BstNI 

X BsiLI >< Tfl1 

>< ApyI >< Mnll Hinfl >< 

CTTCCAGGTT ACAATAGCAG AG AT AT TG AT TATCATTATG AGGACTTTCA GGATTGCTAT TTGGAATCTT 
27100 27110 27120 27130 27140 27150 27160 

>< BsmAI >< Tru9I > < Mnll 

>< Maell >< Alw26I >< Msel X Ddel >< MboII 

GACGTTATAA TAAGTTCAAT AGTGAGACAA TTATTTAAGC CTCTAACTAA GAAGAATTAT TCGGAGTTAG 

27170 27180 27190 27200 27210 27220 27230 

X Ksp632I 
>< MboII >< Earl 

x MboII >< NlaIIIEamll04I >< 

ATGATGAAGA ACCTATGGAG TTAGATTATC CATAAAACGA ACATGAAAAT TATTCTCTTC CTGACATTGA 
27240 27250 27260 27270 27280 27290 27300 

> < Rsal X Rsal 
X Csp6I X Csp6I 
> < Alul >< Mnll > < Afal X Afal 

TTGTATTTAC ATCTTGCGAG CTATATCACT ATCAGGAGTG TGTTAGAGGT ACGACTGTAC TACTAAAAGA 
27310 27320 27330 27340 27350 27360 27370 

X Mnll >< HphI X HphI >< Mnll 

• ACCTTGCCCA TCAGGAACAT ACGAGGGCAA TTCACCATTT CACCCTCTTG CTGACAATAA AT TT GCACT A 
27380 27390 27400 27410 27420 27430 27440 



X 
X 



Rmal 
Mael 



X TthHB8I 
X TaqI 
>< Rsal 
X Csp6I 

X Bbvl 
X Afal 



>< 



> < 



Sau3AI > 
PvuII 
PspSI 
NspBII 
Ndell > 
Mbol > 
Fnu4HI 
DpnII > 
BspAI > 
Alul 



ACTTGCACTA GCACACACTT TGCTTTTGCT TGTGCTGACG GTACTCGACA TACCTATCAG CTGCGTGCAA 



27450 



27460 



27470 



27480 



>< HphI 
X Dpnl 



>< Mnll 

FIGURE 13. 63 



27490 27500 

>< SstI 
X Sdul 
>< Sad 
>< NspII 
>< HgiAI 
>< Eco24I 
< Ecll36II 

X BspWI 
X Bspl286I 
X Bmyl 
>< Banll 
X Alw21I 



27510 
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>< Bspl43I >< Mnll > < Alul Bbvl >< 

GATCAGTTTC ACCAAAACTT TTCATCAGAC AAGAGGAGGT TCAACAAGAG CTCTACTCGC CACTTTTTCT 
27520 27530 27540 27550 27560 27570 27580 



SstI X 
Sdul >< 
SacI >< 
NspII >< 
HgiAI >< 
Eco24I >< 
Ecll36II >< 
Bspl286I x 
Bmyl >< 

>< Rmal >< Tru9I Banll >< 

>< Mael >< Msel >< Tru9I Alw21I >< 

>< Fnu4HI >< HphT >< Msel Alul X 

CATTGTTGCT GCTCTAGTAT TTTTAATACT TTGCTTCACC ATTAAGAGAA AGACAGAATG AATGAGCTCA 
27590 27600 27610 27620 27630 27640 27650 

>< Tru9I >< Tru9I 

>< Msel >< Msel 

CTTTAATTGA CTTCTATTTG TGCTTTTTAG CCTTTCTGCT ATTCCTTGTT TTAATAATGC TTATTATATT 



27660 



27670 



27680 



27690 



27700 



27710 



27720 



X XhoII 
>< Xbal 

> < ScrFI 

>< Sau3AI 

>< Rmal 
>< Ndell 

> < Mval 

>< Mfll 
>< Mbol 
>< EcoRUX Mael 

> < Ecll36I 

>< DpnII 

X Dpnl 
>< BstYI 

> < BstOI 

> < BstNI 

>< TthHB8I >< BspAI > < Rsal 

x DsaVx Bspl43I x MboII 

> < BsiLI x Csp6I 

X Taql > < Apyl > < Alwl > < Afar x Nlalll 

TTGGTTTTCA CTCGAAATCC AGGATCTAGA AGAACCTTGT ACCAAAGTCT AAAC G AAC AT GAAACTTCTC 
27730 27740 27750 27760 27770 27780 27790 



>< HinPlI 
x Hin6I 
>< Hhal 
x Rsal x Haell 
>< Sfcl x Eco47III 

X Csp6IX Cfol SfaNI X 
x Ndel x Afal X Bspl4 3ll 

ATTGTTTTGA CTTGTATTTC TCTATGCAGT TGCATATGCA CTGTAGTACA GCGCTGTGCA TCTAATAAAC 
27800 27810 27820 27830 27840 27850 27860 

>< XhoXI 
X Sau3AI 
X Ndell 
> < Mnll 

X Mfll 



T7T/-1T TT> T7 1 £Z A 
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>< Mbol 
X DpnII 

>< Dpnl >< Rsal 

>< BstYI >< MboII 
>< NlalllX BspAI >< Csp6I >< Rmal 

>< Alwl >< Bspl43I >< Afal >< Mael 
CTCATGTGCT TGAAGATCCT TGTAAGGTAC AACACTAGGG GTAATACTTA TAGCACTGCT TGGCTTTGTG 
27870 27880 27890 27900 27910 27920 27930 



>< Sdul 

>< Rmal 
>< NspII 

X Mael 
>< HgiAI 

>< Bspl28 6I >< N S pi 

>< Bn iyl >< NspHI 

>< Alw21I >< Nlalll x Maelll 

CTCTAGGAAA GGTTTTACCT TTTCATAGAT GGCACACTAT GGTTCAAACA TGCACACCTA ATGTTACTAT 



27940 



27950 



27960 



27970 



27980 



27990 



28000 



> 
> 



>< 



> 
> 
> 

> 
> 
> 

Alwl 



XhoII 
Sau3AI 
X 
X 

Ndell 



> < Van91I 
PvuII 
Psp5I 

> < Pf 1MI 



< MfllX NspBII 

< DpnII x HinPlI 
X Bspl43I X Hin6I 

< BstYI > < BslI >< Hhal X Rmal 

< BspAI > < BsiYIx Cfol ' X Mael 

< Mboix Aluix BspWI X BspWI 
X Dpnl > < AccB7I >< Alul 



X Rsal 

x NlalV 
>< Kpnl 
X Eco64I 
X Csp6Ix HphI 

X BscBI X 
X BanI X BspHI 
>< Asp718 X 

>< Afal X 
X AccBlI x 



>< Nlalll 

x Maelll 



Eco0651 



Eco91I 

BstPI 

BstEII 



X Acc65I 



>< Bbvl 



CAACTGT CAA GATCCAGCTG GTGGTGCGCT TATAGCTAGG TGTTGGTACC TTCATGAAGG T C ACC AAAC T" 



28010 



28020 



28030 



28040 



28050 



28060 



28070^ 



>< Fnu4HI 
X Esp3I 
X BsmAI 
X Alw26I 



X Rsal 
>< Mael I 
>< Csp6I 
>< BsmBI 
X Afal 



x Tru9I 
X Msel 
X Dral 



X Tru9I 
x Msel 



>< SinI 
>< Sau96I 
X NspIV 
NspHII X 
NlalV X 

>< Eco47I 
X Cfrl3I 
X BsiZI 
BscBI X 

>< Bmel8I 
>< Avail 
X Asul 



GCTGCATTTA GAGACGTACT TGTTGTTTTA AATAAACGAA CAAATTAAAA TGTCTGATAA TGGACCCCAA 



28080 



28090 



28100 



28110 



28120 



28130 



28140 



>< Maell 



>< Sdul 
>< NspII 
>< Bspl286I 
>< Bmyl 

X Acil 



>< SinI 
>< Sau96I 
>< NspIV 
X NspHII 

>< NlalV 
>< Eco47l 
x Cfrl3I 
>< BsiZI 

>< BscBI 
x Bmel8I 
X Avail X Tfil 
X Asul X Hinfl 



>< Mnll 



FIGURE 13. 65 
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TCAAACCAAC GTAGTGCCCC CCGCATTACA TTTGGTGGAC CCACAGATTC AACTGACAAT AACCAGAATG 
28150 28160 28170 28180 28190 28200 28210 

>< HinPlI >< Styl 
>< Haell 

> < Pall >< Hin6I >< EcoT14I 

> < Haelll >< HhalX Ecol30I 

>< BspWI >< BssTlI 

> < BsuRI >< Bspl43II 

>< Hgal> < BshI >< Cfolx BsaJI >< Hgal 

GAGGACGCAA TGGGGCAAGG CCAAAACAGC GCCGACCCCA AGGTTTACCC AATAATACTG CGTCTTGGTT 
28220 28230 28240 28250 28260 28270 28280 

>< TthHB8J 

> < ScrFI 
>< Pall 

>< PaeR7I 
>< NspIII 

> < Mval 
>< Haelll 
>< EcoRII 

>< Eco88I 

>< Xhol > < Ecll36I 
>< DsaV 
>< BsuRI 
>< Slal > < BstOI 
>< MnllX Taql> < BstNI 
X Ccrl > < BsiLI 
X Hinfl x BshI 

X TfilX BcolX BsaJX 
><c Mnl1 >< Ddel >< Aval > < Apyl 

>< Alul X Ddel > < Nlalll X Bfrl x Ama87I X Mnll 
CACAGCTCTC ACTCAGCATG GCAAGGAGGA AC T TAGATTC CCTCGAGGCC AGGGCGTTCC AATCAACACC 
28290 28300 28310 28320 28330 28340 28350 

X SinI 
>< .Sau96l 
>< NspIV 

>< NspHII 
X Eco47I 
>< Cfrl3I 
>< BsiZI 

>< Bmel8I > < Ksp632I 

x Avail > < Eamll04'I 

><C ASUl > < Ea *I > < AluIX MboII X MaeiTT 

AATAGTGGTC CAGATGACCA AATTGGCTAC TACCGAAGAG CTACCCGACG AGTTCGTGGT GGTGaScA 
28360 28370 28380 28390 28400 28410 28420 

>< SstI 
X Sdul 
x Sad 
>< NspII 
>< HgiAI 
>< Espl 

><: Eco241 X Sau96I 



x Pall 
>< NspIV 
X Haelll 



>< EC1136II >< styI 

>< Dd ®I >< Rroaj 

>< Cel11 >< Mael 

X Bspl286I >< EcoT14I X Cfrl3I 

>< Bpull02I >< Ecol30I X BsuRI 

><c Bm y x >< BssTlI > < BsrI 

>< Banll >< R S aI x BsaJI X BsiZI 
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>< Alw21I >< Csp6I >< Blnl >< Bshlx Hindlll 

>< HphI >< Alul >< Afal >< Avrll >< Asul >< Alul 

AAATGAAAGA GCTCAGCCCC AGATGGTACT TCTATTACCT AGGAACTGGC CCAGAAGCTT CACTTCCCTA 
28430 28440 28450 28460 28470 28480 28490 

>< HinPlI 
>< Hin6I 
>< Hhal' 
>< Haell 

>< Cfol > < Mnll >< NlalV 

>< Bspl4 3II X SfaNI X Ddel >< BscBI 

CGGCGCTAAC AAAGAAG GC A TCGTATGGGT TGCAACTGAG GGAGCCTTGA ATACACCCAA AGACCACATT 
28500 28510 28520 28530 28540 28550 28560 

X NlalV 
X Eco64I 

x BscBI 
X BanI 

X Acil 

X AccBlI >< Bbvl X Fnu4HI X Mnll 

GGCACCCGCA ATCCTAATAA CAATGCTGCC ACCGTGCTAC AACTTCCTCA AGGAACAACA TTGCCAAAAG 
28570 28580 28590 28600 28610 28620 28630 



>< Thai 
>< Mnll 
>< Maell >< Mvnl 
x Mnll BstUI >< 

X Fnu4HI X Ksp632I BspSOI X 

X BspWI X Earl X BsaAIX Acil 

>< Mnll X Mnll X AcilX MboII X Eamll04I AccII X 

GCTTCTACGC AGAGGGAAGC AGAGGCGGCA GTCAAGCCTC TTCTCGCTCC TCATCACGTA GTCGCGGTAA 
28640 28650 28660 28670 28680 28690 28700 v 

x ScrFI Jj. 
X Mval 

>< EcoRII X TthHB8I 

x Ecll36I >< Rmal 

X DsaVX Fnu4HI >< Nhel 

X BstOI >< Mnll 

x BstNI X Mael 

X BsiLI > < BspWI 

X Apyl X Bbvl X TaqI X Acil 

TTCAAGAAAT TCAACTCCTG GCAGCAGTAG GGGAAATTCT CCTGCTCGAA TGGCTAGCGG AGGTGGTGAA 

28710 28720 28730 28740 28750 28760 28770 

> < Thai 

> < Mvnl 

x HphI X Mnll 

> < HinPlI 

> < Hin6I 

>< Hhal 

> < BstUI >< Rmal Pall X 

> < BspSOI X Mael Haelll X 
>< Bbvl X CfoIX Fnu4HI BsuRI >< 

> < AccIlX BspWI X Alul BshI X 
ACTGCCCTCG CGCTATTGCT GCTAGACAGA TTGAACCAGC TTGAGAGCAA AGTTTCTGGT AAAGGCCAAC 

28780 28790 28800 28810 28820 28830 28840 



Rsal x 

> < Palix Maelll x Mnll 

> < Haelll >< Fnu4HI Maell >< 

> < BsuRI X Ddel X Ddel Csp6I X 

FIGURE 13.67 
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> < BshI > < Bbvl >< Mnll >< BspWI >< SfaNI AfaT 

AACM SSS CCAAACTGTC ACTAAGAAAT CTGCTGCTGA GGCATCTAAA AAGCCTCGCC AAAAACGTAC 



28860 



28870 



28880 



28890 



28900 



28910 



>< Tthllll 
>< SinI 
>< Sau96I 
>< NspIV 
>< NspHII 
> < Maell 

>< Eco4 7I 
>< Cfrl3l 
>< BsmBI 

>< Rsal >< BsizI >K gt - 

X Maelll >< BmelSI >< EcoT14I 

w r > ^ T MaeI1 >< Es P 31 X Avail >< Ecol30I 

>K Cs P 61 >< BsmAI >< Asul >< BssTlI 

>< Afal >< Alw2 6I> < Aspl >< r^it 

T GC CACAAAA CAGTACAACG TCACTCAAGC ATTTGGGAGA CGTgStCCAG AACAAACCCA aSgLaTTTC 
28920 28930 28940 28950 28960 28970 28980 

>< SinI 
>< Sau96I 
>< NspIV 
X NspHII 
>< NlalV 
>< Eco47I 
>< Cfrl3I 
>< BsiZI 

>< BscBI 
>< Bmel8I 
>< Avail 
>< Asul 



>< Pall 
>< Haelll 
>< Gdill 

X Fnu4HI 
X Eael 
X BsuRI 
>< BshI 
>< Acil 



BspWI 
BspWI 



ggggaccaag acctaatcag acaaggaact gattacaaac attggccgca aattgcacaa SiSSSiia 

28990 29000 29010 29020 29030 29040 29050 

>< BsmI ><c NiaIII 

X BscCI x Mnll X Maelll >< Maelll x NlaTTT 

gtgcctctgc attctttgga atgtcacgca ttggcatgga agtcacacct tcgggaacat ggcS a 

29060 29070 29080 29090 29100 29110 29120 

X XhoII 
>< Sau3AI 
X Ndell 
>< Mfll 
X Mbol 

>< Fokl 
X DpnII 

> < Dpnl 
X BstYI 
X BspAI 

BstXlX Alwl> < Bspl43I >< asdi • ->t 

tcat ggagcc attaaattgg atgacaaaga tccacaattc aaagacaacS tcatactgS P gLc^gcac 

29130 29140 29150 . 29160 29170 29180 29190 



x Tru9l 
X NlalV 
X NiaIII 

X Msel 
>< BscBI X 



X Tthllll 
>< Maell 
>< Aspl 



Espl >< 
Ddel X 
Celll x 

X Hgal Bpull02I X 

ATTGACGCAT AC*™ CCCACCAACA CAGCC.AAAA AOCACAAAAA gaa™ 
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>< Plel 

>< Fnu4HI >< MboII 

>< BspWI >< MboII >< Ksp632I >< Gsul 

>< BsmAI >< Maelll >< Earix Fnu4HI 

>< Alw26I >< Hinfl >< Eamll04I>< Bpml 

>< Acil >< Fnu4HI >< Bbvl >< Acil >< Nlalll 

AGCCTTTGCC GCAGAGACAA AAGAAGCAGC CCACTGTGAC TCTTCTTCCT GCGGCTGACA TGGATGATTT 
29270 29280 29290 29300 29310 29320 29330 

>< Nlalll >< Hinfl Nlalll >< 

>< Fokl >< Alul >< TfilX Ddel >< BspHI 

CTCCAGACAA CTTCAAAATT CCATGAGTGG AGCTTCTGCT GATTCAACTC AGGCATAAAC ACTCATGATG 
29340 29350 29360 29370 29380 29390 29400 

>< Maell >< AccI 

ACCACACAAG GCAGATGGGC TATGTAAACG TTTTCGCAAT TCCGTTTACG ATACATAGTC TACTCTTGTG 
29410 29420 29430 29440 29450 29460 29470 

>< Tru9I 
>< Tru9l 

>< Ms el 
>< Msel 

X XmnI >< Hpal 

>< EcoRix Maelll >< Hindu Tru9I >< 

>< Asp700I >< Bsgl >< Hindi Msel >< 

CAGAATGAAT TCTCGTAACT AAACAGCACA AGTAGGTTTA GTTAACTTTA ATCTCACATA GCAATCTTTA 
29480 29490 29500 29510 29520 29530 29540 

Xorll > 
TthHB8I > 
TaqI > 
Sau3AI X 
Rsal >< 
>< ThalPvuI > 
Ndell >< 
>< Mnll 
>< MvnIMcrl > 
Mbol >< 
DpnII >< 
Dpnl >< 
Csp6I >< 
>< BstUI 
>< Haelll BspCI > 
BspAI >< 
>< TthHB8I X Bsp50I 

X Pall Bspl43I X 
X BsuRI BsiEI > 
X BshlAfal X 

>< Mnll >< TaqI X Acil 

x Maelll >< Mnll x AccII 

ATCAATGTGT AACATTAGGG AGGACTTGAA AGAGCCACCA CATTTTCATC GAGGCCACGC GGAGTACGAT 
29550 29560 29570 29580 29590 29600 29610 

>< Sdul 
X NspII 

X MboII X Vspl 

>< Ksp632I X Eco24I X Tru9I 

X Rsal >< Rmal >< Fnu4HI >< Bspl286I X Msel 

X Csp6I >< Mael >< Earl >< Bmyl x Asnl 

X Afal x Bbvl > < AluIX Earall04I x Banll >< Asel 



FIGURE 13.69 
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CGAGGGTACA GTGAATAATG CTAGGGAGAG CTGCCTATAT GGAAGAGCCC TAATGTGTAA AATTAATTTT 
29620 29630 29640 29650 29660 29670 29680 

>< Tru9I >< Ddel 
>< Msel >< Bfrl 
>< Nlalll > < Alul 
AGTAGTGCTA TCCCCATGTG ATTTTAATAG CTTCTTAGGA GAATGACAAA AAAAAAAAAA AAAAAA 
^9690 29700 29710 29720 29730 29740 



CT/OT TT>T? 1 1 



1(1 



ft 

S226CAS108.ST25 
SEQUENCE LISTING 

<110> INSTITUT PASTEUR 

CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE 

<120> Nouvelle souche de coronavirus associe au SRAS et ses applications 

<130> F226CAS108 

<160> 75 

<170> Patentln version 3.1 

<210> 1 

<211> 29746 

<212> DNA 

<213> CORONAVIRUS 



<400> 1 
atattaggtt 


tttacctacc 


caggaaaagc 


caaccaacct 


cgatctcttg 


tagatctgtt 


60 


ctctaaacga 


actttaaaat 


ctgtgtagct 


gtcgctcggc 


tgcatgccta 


gtgcacctac 


120 


gcagtataaa 


caataataaa 


ttttactgtc 


gttgacaaga 


aacgagtaac 


tcgtccctct 


180 


tctgcagact 


gcttacggtt 


tcgtccgtgt 


tgcagtcgat 


catcagcata 


cctaggtttc 


240 


gtccgggtgt 


gaccgaaagg 


taagatggag 


agccttgttc 


ttggtgtcaa 


cgagaaaaca 


300 


cacgtccaac 


tcagtttgcc 


tgtccttcag 


gttagagacg 


tgctagtgcg 


tggcttcggg 


360 


gactctgtgg 


aagaggccct 


atcggaggca 


cgtgaacacc 


tcaaaaatgg 


cacttgtggt 


420 


ctagtagagc 


tggaaaaagg 


cgtactgccc 


cagcttgaac 


agccctatgt 


gttcattaaa 


480 


cgttctgatg 


ccttaagcac 


caatcacggc 


cacaaggtcg 


ttgagctggt 


tgcagaaatg 


540 


gacggcattc 


agtacggtcg 


tagcggtata 


acactgggag 


tactcgtgcc 


acatgtgggc 


600 


gaaaccccaa 


ttgcataccg 


caatgttctt 


cttcgtaaga 


acggtaataa 


gggagccggt 


660 


ggtcatagct 


atggcatcga 


tctaaagtct 


tatgacttag 


gtgacgagct 


tggcactgat 


720 


cccattgaag 


attatgaaca 


aaactggaac 


actaagcatg 


gcagtggtgc 


actccgtgaa 


780 


ctcactcgtg 


agctcaatgg 


aggtgcagtc 


actcgctatg 


tcgacaacaa 


tttctgtggc 


840 


ccagatgggt 


accctcttga 


ttgcatcaaa 


gattttctcg 


cacgcgcggg 


caagtcaatg 


900 


tgcactcttt 


ccgaacaact 


tgattacatc 


gagtcgaaga 
Page 1 


gaggtgtcta 


ctgctgccgt 


960 
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gaccatgagc atgaaattgc ctggttcact gagcgctctg ataagagcta cgagcaccag 1020 

acacccttcg aaattaagag tgccaagaaa tttgacactt tcaaagggga atgcccaaag 1080 

tttgtgtttc ctcttaactc aaaagtcaaa gtcattcaac cacgtgttga aaagaaaaag 1140 

actgagggtt tcatggggcg tatacgctct gtgtaccctg ttgcatctcc acaggagtgt 1200 

aacaatatgc acttgtctac cttgatgaaa tgtaatcatt gcgatgaagt ttcatggcag 1260 

acgtgcgact ttctgaaagc cacttgtgaa cattgtggca ctgaaaattt agttattgaa 1320 

ggacctacta catgtgggta cctacctact aatgctgtag tgaaaatgcc atgtcctgcc 1380 

tgtcaagacc cagagattgg acctgagcat agtgttgcag attatcacaa ccactcaaac 1440 

attgaaactc gactccgcaa gggaggtagg actagatgtt ttggaggctg tgtgtttgcc 1500 

tatgttggct gctataataa gcgtgcctac tgggttcctc gtgctagtgc tgatattggc 1560 

tcaggccata ctggcattac tggtgacaat gtggagacct tgaatgagga tctccttgag 1620 

atactgagtc gtgaacgtgt taacattaac attgttggcg attttcattt gaatgaagag 1680 

gttgccatca ttttggcatc tttctctgct tctacaagtg cctttattga cactataaag 1740 

agtcttgatt acaagtcttt caaaaccatt gttgagtcct gcggtaacta taaagttacc 1800 

aagggaaagc ccgtaaaagg tgcttggaac attggacaac agagatcagt tttaacacca 1860 

ctgtgtggtt ntccctcaca ggctgctggt gttatcagat caatttttgc gcgcacactt 1920 

gatgcagcaa accactcaat tcctgatttg caaagagcag ctgtcaccat acttgatggt 1980 

atttctgaac agtcattacg tcttgtcgac gccatggttt atacttcaga cctgctcacc 2040 

aacagtgtca ttattatggc atatgtaact ggtggtcttg tacaacagac ttctcagtgg 2100 

ttgtctaatc ttttgggcac tactgttgaa aaactcaggc ctatctttga atggattgag 2160 

gcgaaactta gtgcaggagt tgaatttctc aaggatgctt gggagattct caaatttctc 2220 

attacaggtg tttttgacat cgtcaagggt caaatacagg ttgcttcaga taacatcaag 2280 

gattgtgtaa aatgcttcat tgatgttgtt aacaaggcac tcgaaatgtg cattgatcaa 2340 

gtcactatcg ctggcgcaaa gttgcgatca ctcaacttag gtgaagtctt catcgctcaa 2400 

agcaagggac tttaccgtca gtgtatacgt ggcaaggagc agctgcaact actcatgcct 2460 

cttaaggcac caaaagaagt aacctttctt gaaggtgatt cacatgacac agtacttacc 2520 

tctgaggagg ttgttctcaa gaacggtgaa ctcgaagcac tcgagacgcc cgttgatagc 2580 

ttcacaaatg gagctatcgt tggcacacca gtctgtgtaa atggcctcat gctcttagag 2640 

attaaggaca aagaacaata ctgcgcattg tctcctggtt tactggctac aaacaatgtc 2700 

tttcgcttaa aagggggtgc accaattaaa ggtgtaacct ttggagaaga tactgtttgg 2760 

gaagttcaag gttacaagaa tgtgagaatc acatttgagc ttgatgaacg tgttgacaaa 2820 

gtgcttaatg aaaagtgctc tgtctacact gttgaatccg gtaccgaagt tactgagttt 2880 

gcatgtgttg tagcagaggc tgttgtgaag actttacaac cagtttctga tctccttacc 2940 

aacatgggta ttgatcttga tgagtggagt gtagctacat tctacttatt tgatgatgct 3000 
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ggtgaagaaa acttttcatc acgtatgtat tgttcctttt accctccaga tgaggaagaa 3060 

gaggacgatg cagagtgtga ggaagaagaa attgatgaaa cctgtgaaca tgagtacggt 3120 

acagaggatg attatcaagg tctccctctg gaatttggtg cctcagctga aacagttcga 3180 

gttgaggaag aagaagagga agactggctg gatgatacta ctgagcaatc agagattgag 3240 

ccagaaccag aacctacacc tgaagaacca gttaatcagt ttactggtta tttaaaactt 3300 

actgacaatg ttgccattaa atgtgttgac atcgttaagg aggcacaaag tgctaatcct 3360 

atggtgattg taaatgctgc taacatacac ctgaaacatg gtggtggtgt agcaggtgca 3420 

ctcaacaagg caaccaatgg tgccatgcaa aaggagagtg atgattacat taagctaaat 3480 

ggccctctta cagtaggagg gtcttgtttg ctttctggac ataatcttgc taagaagtgt 3540 

ctgcatgttg ttggacctaa cctaaatgca ggtgaggaca tccagcttct taaggcagca 3600 

tatgaaaatt tcaattcaca ggacatctta cttgcaccat tgttgtcagc aggcatattt 3660 

ggtgctaaac cacttcagtc tttacaagtg tgcgtgcaga cggttcgtac acaggtttat 3720 

attgcagtca atgacaaagc tctttatgag caggttgtca tggattatct tgataacctg 3780 

aagcctagag tggaagcacc taaacaagag gagccaccaa acacagaaga ttccaaaact 3840 

gaggagaaat ctgtcgtaca gaagcctgtc gatgtgaagc caaaaattaa ggcctgcatt 3900 

gatgaggtta ccacaacact ggaagaaact aagtttctta ccaataagtt actcttgttt 3960 

gctgatatca atggtaagct ttaccatgat tctcagaaca tgcttagagg tgaagatatg 4020 

tctttccttg agaaggatgc accttacatg gtaggtgatg ttatcactag tggtgatatc 4080 

acttgtgttg taataccctc caaaaaggct ggtggcacta ctgagatgct ctcaagagct 4140 

ttgaagaaag tgccagttga tgagtatata accacgtacc ctggacaagg atgtgctggt 4200 

tatacacttg aggaagctaa gactgctctt aagaaatgca aatctgcatt ttatgtacta 4260 

ccttcagaag cacctaatgc taaggaagag attctaggaa ctgtatcctg gaatttgaga 4320 

gaaatgcttg ctcatgctga agagacaaga aaattaatgc ctatatgcat ggatgttaga 4380 

gccataatgg caaccatcca acgtaagtat aaaggaatta aaattcaaga gggcatcgtt 4440 

gactatggtg txcgattctt cttttatact agtaaagagc ctgtagcttc tattattacg 4500 

aagctgaact ctctaaatga gccgcttgtc acaatgccaa ttggttatgt gacacatggt 4560 

tttaatcttg aagaggctgc gcgctgtatg cgttctctta aagctcctgc cgtagtgtca 4620 

gtatcatcac cagatgctgt tactacatat aatggatacc tcacttcgtc atcaaagaca 4680 

tctgaggagc actttgtaga aacagtttct ttggctggct cttacagaga ttggtcctat 4740 

tcaggacagc gtacagagtt aggtgttgaa tttcttaagc gtggtgacaa aattgtgtac 4800 

cacactctgg agagccccgt cgagtttcat cttgacggtg aggttctttc acttgacaaa 4860 

ctaaagagtc tcttatccct gcgggaggtt aagactataa aagtgttcac aactgtggac 4920 

aacactaatc tccacacaca gcttgtggat atgtctatga catatggaca gcagtttggt 4980 

ccaacatact tggatggtgc tgatgttaca aaaattaaac ctcatgtaaa tcatgagggt 5040 
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aagactttct ttgtactacc tagtgatgac acactacgta gtgaagcttt cgagtactac 5100 

catactcttg atgagagttt tcttggtagg tacatgtctg ctttaaacca cacaaagaaa 5160 

tggaaatttc ctcaagttgg tggtttaact tcaattaaat gggctgataa caattgttat 5220 

ttgtctagtg ttttattagc acttcaacag cttgaagtca aattcaatgc accagcactt 5280 

caagaggctt attatagagc ccgtgctggt gatgctgcta acttttgtgc actcatactc 5340 

gcttacagta ataaaactgt tggcgagctt ggtgatgtca gagaaactat gacccatctt 5400 

ctacagcatg ctaatttgga atctgcaaag cgagttctta atgtggtgtg taaacattgt 5460 

ggtcagaaaa ctactacctt aacgggtgta gaagctgtga tgtatatggg tactctatct 5520 

tatgataatc ttaagacagg tgtttccatt ccatgtgtgt gtggtcgtga tgctacacaa 5580 

tatctagtac aacaagagtc ttcttttgtt atgatgtctg caccacctgc tgagtataaa 5640 

ttacagcaag gtacattctt atgtgcgaat gagtacactg gtaactatca gtgtggtcat 5700 

tacactcata taactgctaa ggagaccctc tatcgtattg acggagctca ccttacaaag 5760 

atgtcagagt acaaaggacc agtgactgat gttttictaca aggaaacatc ttacactaca 5820 

accatcaagc ctgtgtcgta taaactcgat ggagttactt acacagagat tgaaccaaaa 5880 

ttggatgggt attataaaaa ggataatgct tactatacag agcagcctat agaccttgta 5940 

ccaactcaac cattaccaaa tgcgagtttt gataatttca aactcacatg ttctaacaca 6000 

aaatttgctg atgatttaaa tcaaatgaca ggcttcacaa agccagcttc acgagagcta 6060 

tctgtcacat tcttcccaga cttgaatggc gatgtagtgg ctattgacta tagacactat 6120 

tcagcgagtt tcaagaaagg tgctaaatta ctgcataagc caattgtttg gcacattaac 6180 

caggctacaa ccaagacaac gttcaaacca aacacttggt gtttacgttg tctttggagt 6240 

acaaagccag tagatacttc aaattcattt gaagttctgg cagtagaaga cacacaagga 6300 

atggacaatc ttgcttgtga aagtcaacaa cccacctctg aagaagtagt ggaaaatcct 6360 

accatacaga aggaagtcat agagtgtgac gtgaaaacta ccgaagttgt aggcaatgtc 6420 

atacttaaac catcagatga aggtgttaaa gtaacacaag agttaggtca tgaggatctt 6480 

atggctgctt atgtggaaaa cacaagcatt accattaaga aacctaatga gctttcacta 6540 

gccttaggtt taaaaacaat tgccactcat ggtattgctg caattaatag tgttccttgg 6600 

agtaaaattt tggcttatgt caaaccattc ttaggacaag cagcaattac aacatcaaat 6660 

tgcgctaaga gatrtagcaca acgtgtgttt aacaattata tgccttatgt gtttacatta 6720 

ttgttccaat tgtgtacttt tactaaaagt accaattcta gaattagagc ttcactacct 6780 

acaactattg ctaaaaatag tgttaagagt gttgctaaat tatgtttgga tgccggcatt 6840 

aattatgtga agtcacccaa attttctaaa ttgttcacaa tcgctatgtg gctattgttg 6900 

ttaagtattt gcttaggttc tctaatctgt gtaactgctg cttttggtgt actcttatct 6960 

aattttggtg ctccttctta ttgtaatggc gttagagaat tgtatcttaa ttcgtctaac 7020 

gttactacta tggatttctg tgaaggttct tttccttgca gcatttgttt aagtggatta 7080 
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gactcccttg 
ctagacttga 
aaattctttt 
agtcatttca 
cccgtttctg 
agctatgttc 
aatcgtgcca 
gtctatgcaa 
gacacatttt 
cagtttaaaa 
gtgaaaaatg 
catccgctct 
ctgcctatta 
tctgcttctg 
cttgtatcag 
gacacctttt 
gctcacagcg 
gctgcccgac 
aaactttcac 
acctataata 
gcaaggcata 
aaagactaca 
aacaacatac 
actaaaatct 
gccacattat 
ttgtcaatcc 
gtcactcgtg 
gcatggttta 
gctatcatta 
gcaatcaatg 
tgctacacac 
gctgctgagt 
actaatttgc 
cttatggatg 



attcttatcc 
caartttagg 
atttattagg 
tcagcaattc 
caatggttag 
atatcatgga 
cacgcgttga 
atggaggccg 
gcactggtag 
gaccaatcaa 
gcgcgcttca 
cccattttgt 
atgtcatagt 
tgtactacag 
acgrtggaga 
cagcaacttt 
agttzagcaaa 
aaggtgttgt 
atcactctga 
aggttgaaaa 
txaatgccca 
tgtctttatc 
ctrttagact 
cactcaaggg 
tgtgcgttct 
atgatggtta 
acatcatttc 
gccagcgtgg 
caagagagat 
gtgacttctt 
cttccaaact 
gtacaatttt 
tagagggttc 
gttccatcat 



agctcttgaa 
tctggccgct 
tctttcagct 
ttggctcatg 
gatgtacatc 
tggttgcacc 
gtgtacaact 
tggcttctgc 
tacattcatt 
ccctactgac 
cctctacttt 
caatttagac 
ttttgatggc 
tcagctgatg 
tagtactgaa 
tagtgttcct 
gggtgtagct 
tgataccgat 
cttagaagtg 
catgacgccc 
agtagcaaaa 
tgaacagctg 
aaettgtgct 
tggtaagatt 
tgctgcattg 
cacaaatgaa 
tactgatgat 
tggttcatac 
tggtttcata 
gcattttcta 
cattgagtat 
taaggatgct 
tatttcttat 
acagtttcct 
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accattcagg 
gagtgggttt 
ataatgcagg 
tggtttatca 
ttctttgctt 
tcttcgactt 
attgttaatg 
aagactcaca 
agtgatgaag 
cagtcatcgt 
gacaaggctg 
aatttgagag 
aagtccaaat 
tgccaaccta 
gtttccgtta 
atggaaaaac 
ttagatggtg 
gttgacacaa 
acaggtgaca 
agagatcttg 
agtcacaatg 
cgtaaacaaa 
acaactagac 
gttagtactt 
gtttgttata 
atcattggtt 
tgntttgcaa 
aaaaatgaca 
gtgcctggct 
cctcgtgttt 
agtgattttg 
atgggcaaac 
agtgagcttc 
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tgacgatttc 
tggcatatat 
tgttctttgg 
ttagtattgt 
ctttctacta 
gcatgatgtg 
gcatgaagag 
attggaattg 
ttgctcgtga 
atattgttga 
gtcaaaagac 
ctaacaacac 
gcgacgagtc 
ttctgttgct 
agatgtttga 
ttaaggcact 
tcctttctac 
aggatgttat 
gttgtaacaa 
gcgcatgtat 
tttcactcat 
ttcgtagtgc 
aggttgtcaa 
gttttaaact 
tcgttatgcc 
acaaagccat 
ataaacatgc 
aaagctgccc 
taccgggtac 
ttagtgctgt 
ctacctctgc 
ctgtgccata 
gtccagacac 
tggagggttc 



atcgtacaag 
gttgttcaca 
ctattttgct 
acaaatggca 
catatggaag 
ctataagcgc 
atctttctat 
tctcaattgt 
tttgtcactc 
tagtgttgct 
ctatgagaga 
taaaggttca 
tgcttctaag 
tgaccaagct 
tgcttatgtc 
tgttgctaca 
attcgtgtca 
tgaatgtctc 
tttcatgctc 
tgactgtaat 
ctggaatgta 
tgccaagaag 
tgtcataact 
tatgcttaag 
agtacataca 
tcaggatggt 
tggttttgac 
tgtagtagct 
tgtgctgaga 
tggcaacatt 
ttgcgttctt 
ttgttatgac 
tcgttatgtg 
tgttagagta 



7140 

7200 

7260 

7320 

7380 

7440 

7500 

7560 

7620 

7680 

7740 

7800 

7860 

7920 

7980 

8040 

8100 

8160 

8220 

8280 

8340 

8400 

8460 

8520 

8580 

8640 

8700 

8760 

8820 

8880 

8940 

9000 

9060 

9120 
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gtaacaactt ttgatgctga gtactgtaga catggtacat gcgaaaggtc agaagtaggt 9180 

atttgcctat ctaccagtgg tagatgggtt cttaataatg agcattacag agctctatca 9240 

ggagttttct gtggtgttga tgcgatgaat ctcatagcta acatctttac tcctcttgtg 9300 

caacctgtgg gtgctttaga tgtgtctgct tcagtagtgg ctggtggtat tattgccata 9360 

ttggtgactt gtgctgccta ctactttatg aaattcagac gtgtttttgg tgagtacaac 9420 

catgttgttg ctgctaatgc acttttgttt ttgatgtctt tcactatact ctgtctggta 9480 

ccagcttaca gctttctgcc gggagtctac tcagtctttt acttgtactt gacattctat 9540 

ttcaccaatg atgtttcatt cttggctcac cttcaatggt ttgccatgtt ttctcctatt 9600 

gtgccttttt ggataacagc aatctatgta ttctgtattt ctctgaagca ctgccattgg 9660 

ttctttaaca actatcttag gaaaagagtc atgtttaatg gagttacatt tagtaccttc 9720 

gaggaggctg ctttgtgtac ctttttgctc aacaaggaaa tgtacctaaa attgcgtagc 9780 

gagacactgt tgccacttac acagtataac aggtatcttg ctctatataa caagtacaag 9840 

tatttcagtg gagccttaga tactaccagc tatcgtgaag cagcttgctg ccacttagca 9900 

aaggctctaa atgactttag caactcaggt gctgatgttc tctaccaacc accacagaca 9960 

tcaatcactt ctgctgttct gcagagtggt tttaggaaaa tggcattccc gtcaggcaaa 10020 

gttgaagggt gcatggtaca agtaacctgt ggaactacaa ctcttaatgg attgtggttg 10080 

gatgacacag tatactgtcc aagacatgtc atttgcacag cagaagacat gcttaatcct 10140 

aactatgaag atctgctcat tcgcaaatcc aaccatagct ttcttgttca ggctggcaat 10200 

gttcaacttc gtgttattgg ccattctatg caaaattgtc tgcttaggct taaagttgat 10260 

acttctaacc ctaagacacc caagtataaa tttgtccgta tccaacctgg tcaaacattt 10320 

tcagttctag catgctacaa tggttcacca tctggtgttt atcagtgtgc catgagacct 10380 

aatcatacca ttaaaggttc tttccttaat ggatcatgtg gtagtgttgg rtttaacatt 10440 

gattatgatt gcgtgtcttt ctgctatatg catcatatgg agcttccaac aggagtacac 10500 

gctggtactg acttagaagg taaattctat ggtccatttg ttgacagaca aactgcacag 10560 

gctgcaggta cagacacaac cataacatta aatgttttgg catggctgta tgctgctgtt 10620 

atcaatggtg ataggtggtt tcttaataga rtcaccacta ctttgaatga ctttaacctt 10680 

gtggcaatga agtacaacta tgaacctttg acacaagatc atgttgacat attgggacct 10740 

ctttctgctc aaacaggaat tgccgtctta gatatgtgtg ctgctttgaa agagctgctg 10800 

cagaatggta tgaatggtcg tactatcctt ggtagcacta ttttagaaga tgagtttraca 10860 

ccatttgatg ttgttagaca atgctctggt gttaccttcc aaggtaagtt caagaaaatt 10920 

gttaagggca ctcatcattg gatgctttta actttcttga catcactatt gattcttgtt 10980 

caaagtacac agtggtcact gtttttcttt gtttacgaga atgctttctt gccatttact 11040 

cttggtatta tggcaattgc tgcatgtgct atgctgcttg ttaagcataa gcacgcattc 11100 

ttgtgcttgt ttctgttacc ttctcttgca acagttgctt actttaatat ggtctacatg 11160 

Page 6 



S226CAS108.ST25 



cctgctagct 


gggtgatgcg 


tatcatgaca 


tggcttgaat 


tggctgacac 


tagcttgtct 


11220 




qqttataggc 


ttaaggattg 


tgttatgtat 


gcttcagctt 


tagttttget 


tattctcatg 


11280 




acagctcgca 


ctgtttatga 


tgatgetget 


agacgtgttt 


ggacactgat 


gaatgtcatt 


11340 




acacttgttt 


acaaagtcta 


ctatggtaat 


gctttagatc 


aagctatttc 


catgtgggcc 


11400 




ttagttattt 


ctgtaacctc 


taactattct 


ggtgtcgtta 


cgactatcat 


gtttttagct 


11460 




agagctatag 


tgtttgtgtg 

w Zs 3 3 3 


tgttgagtat 


tacccattgt 


tatttattac 


tggcaacacc 


11520 




ttacaatata 


tcatgcttgt 


ttattgtttc 


ttaggctatt 


gttgctgctg 


ctactttggc 


11580 




cttttctgtt 


tactcaaccg 


ttacttcagg 


cttactcttg 


gtgtttatga 


ctacttggtc 


11640 




tctacacaag 


aatttaggta 


tatgaactcc 


caggggcttt 


tgcctcctaa 


gagtagtatt 


11700 




gatgctttca 


agcttaacat 


taagttgttg 


ggtattggag 


gtaaaccatg 


tatcaaggtt 


11760 




gctactgtac 


agtctaaaat 


gtctgacgta 


aagtgcacat 


ctgtggtact 


getcteggtt 


11820 




cttcaacaac 


ttagagtaga 


gtcatcttct 


aaattgtggg 


cacaatgtgt 


acaactccac 


11880 




aatgatattc 


ttcttgcaaa 


agacacaact 


gaagctttcg 


agaagatggt 


ttctcttttg 


11940 




tctgttttgc 


tatccatgca 


gggtgctgta 


gacattaata 


ggttgtgcga 


ggaaatgetc 


12000 


V 


gataaccgtg 


ctactcttca 


ggctattget 


tcagaattta 


gttctttacc 


ateatatgee 


12060 




gcttatgcca 


ctgcccagga 


ggectatgag 


caggctgtag 


ctaatggtga 


ttctgaagtc 


12120 




gttctcaaaa 


agttaaagaa 


atctttgaat 


gtggctaaat 


ctgagtttga 


ccgtgatgct 


12180 


.. 


arcatacaac 

mm \— U I* ^4 v* V* 




aaaaatqqca 


gatcaggcta 


tgacccaaat 


gtacaaacag 


12240 


& 


y v_cic*y cv i»v» *-y 


aoaacaaaaa 


ggcaaaagta 


actagtgeta 


tgcaaacaat 


gctcttcact 


12300 




at: a cttaaaa 


agcttgataa 


tgatgeaett 


aacaacatta 


teaacaatge 


gcgtgatggt 


12360 






tea a cat cat 


accattgact 


acagcagcca 


aactcatggt 


tgttgtccct 


12420 




gattatggta 


cctacaagaa 


cacttgtgat 


ggtaacacct 


ttacatatgc 


atctgcactc 


12480 




tgggaaatcc 


agcaagttgt 


tgatgeggat 

3 3 33 


agcaagattg 


ttcaacttag 


tgaaattaac 


12540 




atggacaatt 


caccaaattt 


ggcttggcct 


cttattgtta 


cagctctaag 


agccaactca 


12600 




gctgttaaac 


tacagaataa 


tgaactgagt 


ccagtagcac 


tacgacagat 


gtcctgtgcg 


12660 




gctggtacca 


cacaaacagc 


ttgtactgat 


gaeaatgeae 


ttgectacta 


taacaattcg 


12720 




aagggaggta 


gqtttgtgct 

3 3 3 3 


ggcattacta 


tcagaccacc 


aagatctcaa 


atgggctaga 


12780 




ttccctaaga 


gtgatqgtac 

3 3 33 


aggtacaatt 


tacacagaac 


tggaaccacc 


ttgtaggttt 


12840 




nttaranara 
y u Lduaydv-d 




y v_- t_ c* cm y i_ y 


aaatacttat 

una i.wv» v.y u 


acttcatcaa 


aggcttaaac 


12900 




aacctaaata 


gaggtatggt 


gctgggcagt 


ttagctgeta 


cagtaegtet 


tcaggctgga 


12960 




aatgctacag 


aagtacctgc 


caattcaact 


gtgetttect 


tctgtgcttt 


tgeagtagae 


13020 




cctgctaaag 


catataagga 


ttacctagca 


agtggaggac 


aaccaatcac 


caactgtgtg 


13080 




aagatgttgt 


gtacacacac 


tggtacagga 


caggcaatta 


ctgtaacacc 


agaagctaac 


13140 




atggaccaag 


agtcctttgg 


tggtgcttca 


tgttgtctgt 


attgtagatg 


ccacattgac 


13200 
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catccaaatc ctaaaggatt ctgtgacttg aaaggtaagt acgtccaaat acctaccact 13260 

tgtgctaatg acccagtggg ttttacactt agaaacacag tctgtaccgt ctgcggaatg 13320 

tggaaaggtt atggctgtag ttgtgaccaa ctccgcgaac ccttgatgca gtctgcggat 13380 

gcatcaacgt ttttaaacgg gtttgcggtg taagtgcagc ccgtcttaca ccgtgcggca 13440 

caggcactag tactgatgtc gtctacaggg cttttgatat ttacaacgaa aaagttgctg 13500 

gttttgcaaa gttcctaaaa actaattgct gtcgcttcca ggagaaggat gaggaaggca 13560 

atttattaga ctcttacttt gtagttaaga ggcatactat gtctaactac caacatgaag 13620 

agactattta taacttggtt aaagattgtc cagcggttgc tgtccatgac tttttcaagt 13680 

ttagagtaga tggtgacatg gtaccacata tatcacgtca gcgtctaact aaatacacaa 13740 

tggctgattt agtctatgct ctacgtcatt ttgatgaggg taattgtgat acattaaaag 13800 

aaatactcgt cacatacaat tgctgtgatg atgattattt caataagaag gattggtatg 13860 

acttcgtaga gaatcctgac atcttacgcg tatatgctaa cttaggtgag cgtgtacgcc 13920 

aatcattatt aaagactgta caattctgcg atgctatgcg tgatgcaggc attgtaggcg 13980 

tactgacatt agataatcag gatcttaatg ggaactggta cgatttcggt gatttcgtac 14040 

aagtagcacc aggctgcgga gttcctattg tggattcata ttactcattg ctgatgccca 14100 

tcctcacttt gactagggca ttggctgctg agtcccatat ggatgctgat ctcgcaaaac 14160 

cacttattaa gtgggatttg ctgaaatatg attttacgga agagagactt tgtctcttcg 14220 

accgttattt taaatattgg gaccagacat accatcccaa ttgtattaac tgtttggatg 14280 

ataggtgtat ccttcattgt gcaaacttta atgtgttatt ttctactgtg tttccaccta 14340 

caagttttgg accactagta agaaaaatat ttgtagatgg tgttcctttt gttgtttcaa 14400 

ctggatacca ttttcgtgag ttaggagtcg tacataatca ggatgtaaac ttacatagct 14460 

cgcgtctcag tttcaaggaa cttttagtgt atgctgctga tccagctatg catgcagctt 14520 

ctggcaattt attgctagat aaacgcacta catgcttttc agtagctgca ctaacaaaca 14580 

atgttgcttt tcaaactgtc aaacccggta attttaataa agacttttat gactttgctg 14640 

tgtctaaagg tttctttaag gaaggaagtt ctgttgaact aaaacacttc ttctttgctc 14700 

aggatggcaa cgctgctatc agtgattatg actattatcg ttataatctg ccaacaatgt 14760 

gtgatatcag acaactccta ttcgtagttg aagttgttga taaatacttt gattgttacg 14820 

atggtggctg tattaatgcc aaccaagtaa tcgttaacaa tctggataaa tcagctggtt 14880 

tcccatttaa taaatggggt aaggctagac tttattatga ctcaatgagt tatgaggatc 14940 

aagatgcact tttcgcgtat actaagcgta atgtcatccc tactataact caaatgaatc 15000 

ttaagtatgc cattagtgca aagaatagag ctcgcaccgt agctggtgtc tctatctgta 15060 

gtactatgac aaatagacag tttcatcaga aattattgaa gtcaatagcc gccactagag 15120 

gagctactgt ggtaattgga acaagcaagt tttacggtgg ctggcataat atgttaaaaa 15180 

ctgtttacag tgatgtagaa actccacacc ttatgggttg ggattatcca aaatgtgaca 15240 
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gagccatgcc taacatgctt 


aggataatgg 


cctctcttgt 


tcttgctcgc 


aaacataaca 


15300 


cttgctgtaa cttatcacac 


cgtttctaca ggttagctaa 


cgagtgtgcg 


caagtattaa 


15360 


qtqagatgqt catgtgtggc 


ggctcactat 


atgttaaacc 


aggtggaaca 


tcatccggtg 


15420 


atgctacaac tgcttatgct 


aatagtgtct 


ttaacatttg 


tcaagctgtt 


acagccaatg 


15480 


taaatgcact tctttcaact 


gatggtaata 


agatagctga 


caagtatgtc 


cgcaatctac 


15540 


aacacaaact ctatqaqtqt 


ctctatagaa 


atagggatgt 


tgatcatgaa 


ttcgtggatg 


15600 


aattttacac ttacctqcqt 


aaacatttct 


ccatgatgat 


tctttctgat 


gatgccgttg 


15660 


tcrtactataa caataactat 


gcggctcaag 


gtttagtagc 


tagcattaag 


aactttaagg 


15720 


caattctt*ta "ttatcaaaat 


aatgtgttca tgtctgaggc 


aaaatgttgg 


actgagactg 


15780 


accttactaa aqqacctcac 


gaattttgct 


cacagcatac 


aatgctagtt 


aaacaaggag 


15840 


atgattacgt gtacctgcct 


tacccagatc 


catcaagaat 


attaggcgca 


ggctgttttg 


15900 


tcgatgatat tgtcaaaaca 


gatggtacac ttatgattga 


aaggttcgtg 


tcactggcta 


15960 


ttgatgctta cccacttaca 


aaacatccta 


atcaggagta 


tgctgatgtc 


tttcacttgt 


16020 


atttacaata cattagaaag 


ttacatgatg 


agcttactgg 


ccacatgttg 


gacatgtatt 


16080 


ccgtaatgct aactaatgat 


aacacctcac ggtactggga 


acctgagttt 


tatgaggcta 


16140 


"tgtacacacc acatacagtc 


ttgcaggctg taggtgcttg 


tgtattgtgc 


aattcacaga 


16200 


cttcacttcg ttgcggtgcc 


tgtattagga 


gaccattcct 


atgttgcaag 


tgctgctatg 


16260 


accatgtcat ttcaacatca 


cacaaattag tgttgtctgt 


taatccctat 


gtttgcaatg 


16320 




gatgtgacac aactgtatct 


aaqaaqta"tq 


agctattatt * 


16380 


acaaaiicaca taaacctccc 


attagttttc 


cattatgtgc 


taatggtcag 


gtttttggtt 


16440 


tatacaaaaa cacatatrota 


ggcagtgaca 


atgtcactga 


cttcaatgcg 


atagcaacat 


16500 


a*taai""toaac "taat" a ct*aac 

y *>yci l uy yciv, Luuuy v *>yy »• 


gattacatac 


ttgccaacac 


ttigtactgag 


agactcaagc 


16560 


"ttzftcacaac aaaaacactc 


aaagccactg 


aggaaacatt 


taagctgtca 


tatrggtattg 


16620 


ccactgtiacg cgaag"tactc 


tctgacagag 


aattgcatct 


ttcatgggag 


gttggaaaac 


16680 


ctagaccacc attgaacaga 


aactatgtct 


ttactggtta 


ccgtgtaact 


aaaaatagta 


16740 


aagtacagat tggagagtac 


acctttgaaa 


aaggtgacta 


tggtgatgct 


gttgtgtaca 


16800 


gaggtactac gacatacaag 


ttgaatgttg 


gtgattactt 


tgtgttgaca 


tctcacactg 


16860 


taatgccact tagtgcacct 


actctagtgc 


cacaagagca 


ctatgtgaga 


attactggct 


16920 


tgtacccaac actcaacatc 


tcagatgagt 


tttctagcaa 


tgttgcaaat 


tatcaaaagg 


16980 


tcggcatgca aaagtactct 


acactccaag 


gaccacctgg 


tactggtaag 


agtcattttg 


17040 


ccatcggact tgctctctat 


tacccatctg 


ctcgcatagt 


gtatacggca 


tgctctcatg 


17100 


cagctgttga tgccctatgt 


gaaaaggcat 


taaaatattt 


gcccatagat 


aaatgtagta 


17160 


gaatcatacc tgcgcgtgcg 


cgcgtagagt 


gttttgataa 


attcaaagtg 


aattcaacac 


17220 


tagaacagta tgttttctgc 


actgtaaatg cattgccaga 
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aacaactgct 


gacattgtag 
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tctttgatga 


aatctctatg 


gctactaatt 


atgacttgag tgttgtcaat 


gctagacttc 


17340 


gtgcaaaaca 


ctacgtctat 


attggcgatc 


ctgctcaatt 


accagccccc 


cgcacattgc 


17400 


tgactaaagg 


cacactagaa 


ccagaatatt 


ttaattcagt 


gtgcagactt 


atgaaaacaa 


17460 


taggtccaga 


catgttcctt 


ggaacttgtc 


gccgttgtcc 


tgctgaaatt 


gttgacactg 


17520 


tgagtgcttt 


agtttatgac 


aataagctaa 


aagcacacaa ggataagtca 


gctcaatgct 


17580 


tcaaaatgtt 


ctacaaaggt 


gttattacac 


atgatgtttc 


atctgcaatc 


aacagacctc 


17640 


aaataggcgt 


tgtaagagaa 


tttcttacac 


gcaatcctgc 


ttggagaaaa 


gctgttttta 


17700 


tctcacctta 


taattcacag 


aacgctgtag 


cttcaaaaat 


cttaggattg 


cctacgcaga 


17760 


ctgttgattc 


atcacagggt 


tctgaatatg 


actatgtcat 


attcacacaa 


actactgaaa 


17820 


cagcacactc 


ttgtaatgtc 


aaccgcttca 


atgtggctat 


cacaagggca 


aaaattggca 


17880 


ttttgtgcat 


aatgtctgat 


agagatcttt 


atgacaaact 


gcaatttaca 


agtctagaaa 


17940 


taccacgtcg 


caatgtggct 


acattacaag 


cagaaaatgt 


aactggactt 


tttaaggact 


18000 


gtagtaagat 


cattactggt 


cttcatccta 


cacaggcacc 


tacacacctc 


agcgttgata 


18060 


taaagttcaa 


gactgaagga 


ttatgtgttg 


acataccagg 


cataccaaag 


gacatgacct 


18120 


accgtagact 


catctctatg 


atgggtttca 


aaatgaatta 


ccaagtcaat 


ggttacccta 


18180 


atatgtttat 


cacccgcgaa 


gaagctattc 


gtcacgttcg tgcgtggatt 


ggctttgatg 


18240 


tagagggctg 


tcatgcaact 


agagatgctg 


tgggtactaa 


cctacctctc 


cagctaggat 


18300 


tttctacagg 


tgttaactta 


gtagctgtac 


cgactggtta tgttgacact 


gaaaataaca 


18360 


cagaattcac 


cagagttaat 


gcaaaacctc 


caccaggtga 


ccagtttaaa 


catcttatac 


18420 


cactcatgta 


taaaggcttg 


ccctggaatg 


tagtgcgtat taagatagta 


caaatgctca 


18480 


gtgatacact 


gaaaggattg 


tcagacagag 


tcgtgttcgt 


cctttgggcg 


catggctttg 


18540 


agcttacatc 


aatgaagtac 


tttgtcaaga 


ttggacctga 


aagaacgtgt 


tgtctgtgtg 


18600 


acaaacgtgc 


aacttgcttt 


tctacttcat 


cagatactna 


tgcctgctgg 


aatcattctg 


18660 


tgggttttga 


ctatgtctat 


aacccattta 


tgattgatgt 


tcagcagtgg 


ggctttacgg 


18720 


gtaaccttca 


gagtaaccat 


gaccaacatt 


gccaggtaca 


tggaaatgca 


catgtggcta 


18780 


gttgtgatgc 


tatcatgact 


agatgtttag 


cagtccatga gtgctttgtt 


aagcgcgttg 


18840 


attggtctgt 


tgaataccct 


attataggag 


atgaactgag 


ggttaattct 


gcttgcagaa 


18900 


aagtacaaca 


catggttgtg 


aagtctgcat 


tgcttgctga 


taagtttcca 


gttcttcatg 


18960 


acattggaaa 


tccaaaggct 


atcaagtgtg 


tgcctcaggc 


tgaagtagaa 


tggaagttct 


19020 


acgatgctca 


gccatgtagt 


gacaaagctt 


acaaaataga 


ggaactcttc 


tattcttatg 


19080 


ctacacatca 


cgataaattc 


actgatggtg 


tttgtttgtt 


ttggaattgt 


aacgttgatc 


19140 


gttacccagc 


caatgcaatt 


gtgtgtaggt 


ttgacacaag 


agtcttgtca 


aacttgaact 


19200 


taccaggctg 


tgatggtggt 


agtttgtatg 


tgaataagca 


tgcattccac 


actccagctt 


19260 


tcgataaaag 


tgcatttact 


aatttaaagc 


aattgccttt 
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cttttactat 


tctgatagtc 
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cttgtgagtc tcatggcaaa caagtagtgt cggatattga ttatgttcca ctcaaatctg 19380 

ctacgtgtat tacacgatgc aatttaggtg gtgctgtttg cagacaccat gcaaatgagt 19440 

accgacagta cttggatgca tataatatga tgatttctgc tggatttagc ctatggattt 19500 

acaaacaatt tgatacttat aacctgtgga atacatttac caggttacag agtttagaaa 19560 

atgtggctta taatgttgtt aataaaggac actttgatgg acacgccggc gaagcacctg 19620 

tttccatcat taataatgct gtttacacaa aggtagatgg tattgatgtg gagatctttg 19680 

aaaataagac aacacttcct gttaatgttg catttgagct ttgggctaag cgtaacatta 19740 

aaccagtgcc agagattaag atactcaata atttgggtgt tgatatcgct gctaatactg 19800 

taatctggga ctacaaaaga gaagccccag cacatgtatc tacaataggt gtctgcacaa 19860 

tgactgacat tgccaagaaa cctactgaga gtgcttgttc ttcacttact gtcttgtttg 19920 

atggtagagt ggaaggacag gtagaccttt ttagaaacgc ccgtaatggt gttttaataa 19980 

cagaaggttc agtcaaaggt ctaacacctt caaagggacc agcacaagct agcgtcaatg 20040 

gagtcacatt aattggagaa tcagtaaaaa cacagtttaa ctactttaag aaagtagacg 20100 

gcattattca acagttgcct gaaacctact ttactcagag cagagactta gaggatttta 20160 

agcccagatc acaaatggaa actgactttc tcgagctcgc tatggatgaa ttcatacagc 20220 

gatataagct cgagggctat gccttcgaac acatcgttta tggagatttc agtcatggac 20280 

aacttggcgg tcttcattta atgataggct tagccaagcg ctcacaagat tcaccactta 20340 

aattagagga ttttatccct atggacagca cagtgaaaaa ttacttcata acagatgcgc 20400 

aaacaggttc atcaaaatgt gtgtgttctg tgattgatct tttacttgat gactttgtcg 20460 

agataataaa gtcacaagat ttgtcagtga tttcaaaagt ggtcaaggtt acaattgact 20520 

atgctgaaat ttcattcatg ctttggtgta aggatggaca tgttgaaacc ttctacccaa 20580 

aactacaagc aagtcaagcg tggcaaccag gtgttgcgat gcctaacttg tacaagatgc 20640 

aaagaatgct tcttgaaaag tgtgaccttc agaattatgg tgaaaatgct gttataccaa 20700 

aaggaataat gatgaatgtc gcaaagtata ctcaactgtg tcaatactta aatacactta 20760 

ctttagctgt accctacaac atgagagtta ttcactttgg tgctggctct gataaaggag 20820 

ttgcaccagg tacagctgtg ctcagacaat ggttgccaac tggcacacta cttgtcgatt 20880 

cagatcttaa tgacttcgtc tccgacgcag attctacttt aattggagac tgtgcaacag 20940 

tacatacggc taataaatgg gaccttatta ttagcgatat gtatgaccct aggaccaaac 21000 

atgtgacaaa agagaatgac tctaaagaag ggtttttcac ttatctgtgt ggatttataa 21060 

agcaaaaact agccctgggt ggttctatag ctgtaaagat aacagagcat tcttggaatg 21120 

ctgaccttta caagcttatg ggccatttct catggtggac agcttttgtt acaaatgtaa 21180 

atgcatcatc atcggaagca tttttaattg gggctaacta tcttggcaag ccgaaggaac 21240 

aaattgatgg ctataccatg catgctaact acattttctg gaggaacaca aatcctatcc 21300 

agttgtcttc ctattcactc tttgacatga gcaaatttcc tcttaaatta agaggaactg 21360 
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ctgtaatgtc tcttaaggag aatcaaatca atgatatgat ttattctctt ctggaaaaag 21420 

gtaggcttat cattagagaa aacaacagag ttgtggtttc aagtgatatt cttgttaaca 21480 

actaaacgaa catgtttatt ttcttattat ttcttactct cactagtggt agtgaccttg 21540 

accggtgcac cacttttgat gatgttcaag ctcctaatta cactcaacat acttcatcta 21600 

tgaggggggt ttactatcct gatgaaattt ttagatcaga cactctttat ttaactcagg 21660 

atttatttct tccattttat tctaatgtta cagggtttca tactattaat catacgtttg 21720 

gcaaccctgt catacctttt aaggatggta tttattttgc tgccacagag aaatcaaatg 21780 

ttgtccgtgg ttgggttttt ggttctacca tgaacaacaa gtcacagtcg gtgattatta 21840 

ttaacaattc tactaatgtt gttatacgag catgtaactt tgaattgtgt gacaaccctt 21900 

tctttgctgt ttctaaaccc atgggtacac agacacatac tatgatattc gataatgcat 21960 

ttaattgcac tttcgagtac atatctgatg ccttttcgct tgatgtttca gaaaagtcag 22020 

gtaattttaa acacttacga gagtttgtgt ttaaaaataa agatgggttt ctctatgttt 22080 

ataagggcta tcaacctata gatgtagttc gtgatctacc ttctggtttt aacactttga 22140 

aacctatttt taagttgcct cttggtatta acattacaaa ttttagagcc attcttacag 22200 

ccttttcacc tgctcaagac atttggggca cgtcagctgc agcctatttt gttggctatt 22260 

taaagccaac tacatttatg ctcaagtatg atgaaaatgg tacaatcaca gatgctgttg 22320 

attgttctca aaatccactt gctgaactca aatgctctgt taagagcttt gagattgaca 22380 

aaggaattta ccagacctct aatttcaggg ttgttccctc aggagatgtt gtgagattcc 22440 

ctaatattac aaacttgtgt ccttttggag aggtttttaa tgctactaaa ttcccttctg 22500 

tctatgcatg ggagagaaaa aaaatttcta attgtgttgc tgattactct gtgctctaca 22560 

actcaacatt tttttcaacc tttaagtgct atggcgtttc tgccactaag ttgaatgatc 22620 

tttgcttctc caatgtctat gcagattctt ttgtagtcaa gggagatgat gtaagacaaa 22680 

tagcgccagg acaaactggt gttattgctg attataatta taaattgcca gatgatttca 22740 

tgggttgtgt ccttgcttgg aatactagga acattgatgc tacttcaact ggtaattata 22800 

attataaata taggtatctt agacatggca agcttaggcc crttgagaga gacatatcta 22860 

atgtgccttt ctcccctgat ggcaaacctt gcaccccacc tgctcttaat tgttattggc 22920 

cattaaatga ttatggtttt tacaccacta ctggcattgg ctaccaacct tacagagttg 22980 

tagtactttc ttttgaactt ttaaatgcac cggccacggt ttgtggacca aaattatcca 23040 

ctgaccttat taagaaccag tgtgtcaatt ttaattttaa tggactcact ggtactggtg 23100 

tgttaactcc ttcttcaaag agatttcaac catttcaaca atttggccgt gatgtttctg 23160 

atttcactga ttccgttcga gatcctaaaa catctgaaat attagacatt tcaccttgct 23220 

cttttggggg tgtaagtgta attacacctg gaacaaatgc ttcatctgaa gttgctgttc 23280 

tatatcaaga tgttaactgc actgatgttt ctacagcaat tcatgcagat caactcacac 23340 

cagcttggcg catatattct actggaaaca atgtattcca gactcaagca ggctgtctta 23400 
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taggagctga gcatgtcgac 


acttcttatg 


agtgcgacat 


tcctattgga 


gctggcattt 


23460 


gtgctagtta ccatacagtt 


tctttattac 


gtagtactag 


ccaaaaatct 


attgtggctt 


23520 


atactatgtc tttaggtgct 


gatagttcaa 


ttgcttactc 


taataacacc 


attgctatac 


23580 


ctactaactt ttcaattagc 


attactacag 


aagtaatgcc tgtttctatg 


gctaaaacct 


23640 


ccgtagattg taatatgtac 


atctgcggag 


attctactga atgtgctaat 


ttgcttctcc 


23700 


aatatggtag cttttgcaca 


caactaaatc 


gtgcactctc aggtattgct 


gctgaacagg 


23760 


atcacaacac acqtqaaqtq 


ttcgctcaag 


tcaaacaaat 


gtacaaaacc 


ccaactttga 


23820 


aatattttqq tqqttttaat 


ttttcacaaa 


tattacctga 


ccctctaaag 


ccaactaaga 


23880 


aatcttttat taaqqacttq 


ctctttaata 


aggtgacact 


cgctgatgct 


ggcttcatga 


23940 


aacaatataq cqaataccta 


ggtgatatta 


atgctagaga tctcatttgt 


gcgcagaagt 


24000 


tcaataqact tacaqtqttq 


ccacctctgc 


tcactgatga 


tatgattgct 


gcctacactg 


24060 


ctgctctagt tagtggtact 


gccactgctg 


gatggacatt 


tggtgctggc 


gctgctcttc 


24120 


aaataccttt tgctatgcaa 


atggcatata 


ggttcaatgg 


cattggagtt 


acccaaaatg 


24180 


ttctctatga gaaccaaaaa 


caaatcgcca 


accaatttaa 


caaggcgatt 


agtcaaattc 


24240 


aagaatcact tacaacaaca 


tcaactgcat 


tgggcaagct 


gcaagacgtt 


gttaaccaga 


24300 


atgctcaagc attaaacaca 


cttgttaaac 


aacttagctc 


naattttggt 


gcaatttcaa 


24360 


atatactaaa tqatatcctt: 


tcgcgacttg 


ataaagtcga ggcggaggta 


caaattgaca 


24420 


aattaattac aqacaqactt: 


caaagccttc 


aaacctatgt 


aacacaacaa 


ctaatcaggg 


24480 


rt*actaaaa*t caaaac"t"tct 


gctaatcttg 


ctgctactaa aatgtctgag 


tgtgttcttg 


24540 


y a. v_cici Ltcioa a a y ci y »- *_y c*v_ 


ttttgtggaa 


agggctacca ccttatgtcc 


ttcccacaag 


24600 


ranrccraca ■taatG't'tG'tc 

v. ciy V- v- v_ v-y *— ci uyy y 


ttcctacatg 


tcacgtatgt 


gccatcccag 


gagaggaact 


24660 




tgtcatgaag 


gcaaagcata 


cttccctcgt 


gaaggtgtut 


24720 


■ttatatttaa taacacntct 


tggtttatta 


cacagaggaa 


cttcrtttct 


ccacaaataa 


24780 


ttactacaga caatacattt: 


gtctcaggaa 


attgtgatgt 


cgttattggc 


atcattaaca 


24840 


acacagttta tgatcctctg 


caacctgagc 


ttgactcatt 


caaagaagag 


ctggacaagt 


24900 


acttcaaaaa tcatacatca 


ccagatgttg 


atcttggcga 


catttcaggc 


attaacgctt 


24960 


ctgtcgtcaa cattcaaaaa 


gaaattgacc 


gcctcaatga 


ggtcgctaaa 


aatttaaatg 


25020 


aatcactcat tgaccttcaa 


gaattgggaa 


aatatgagca 


atatattaaa 


tggccttggt 


25080 


atgtttggct cggcttcatt 


gctggactaa 


ttgccatcgt 


catggttaca 


atcttgcttt 


25140 


yxxgcaLyac. *-dy l Ly l lcjl 


agttgcctca 


agggtgcatg 


ctcttgtggt 


T ft* 1" n c t* n c a 


25200 


agtttgatga ggatgactct 


gagccagttc 


tcaagggtgt 


caaattacat 


tacacataaa 


25260 


cgaacttatg gatttgttta 


tgagattttt 


tactcttgga 


tcaattactg 


cacagccagt 


25320 


aaaaattgac aatgcttctc 


ctgcaagtac 


tgttcatgct acagcaacga 


taccgctaca 


25380 


agcctcactc cctttcggat 


ggcttgttat 


tggcgttgca tttcttgctg 


tttttcagag 


25440 
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cgctaccaaa ataattgcgc tcaataaaag atggcagcta gccctttata agggcttcca 25500 

gttcatttgc aatttactgc tgctatttgt taccatctat tcacatcttt tgcttgtcgc 25560 

tgcaggtatg gaggcgcaat ttttgtacct ctatgccttg atatattttc tacaatgcat 25620 

caacgcatgt agaattatta tgagatgttg gctttgttgg aagtgcaaat ccaagaaccc 25680 

attactttat gatgccaact actttgtttg ctggcacaca cataactatg actactgtat 25740 

accatataac agtgtcacag atacaattgt cgttactgaa ggtgacggca tttcaacacc 25800 

aaaactcaaa gaagactacc aaattggtgg ttattctgag gataggcact caggtgttaa 25860 

agactatgtc gttgtacatg gctatttcac cgaagtttac taccagcttg agtctacaca 25920 

aattactaca gacactggta ttgaaaatgc tacattcttc atctttaaca agcttgttaa 25980 

agacccaccg aatgtgcaaa tacacacaat cgacggctct tcaggagttg ctaatccagc 26040 

aatggatcca atttatgatg agccgacgac gactactagc gtgcctttgt aagcacaaga 26100 

aagtgagtac gaacttatgt actcattcgt ttcggaagaa acaggtacgt taatagttaa 26160 

tagcgtactt ctttttcttg ctttcgtggt attcttgcta gtcacactag ccatccttac 26220 

tgcgcttcga ttgtgtgcgt actgctgcaa tattgttaac gtgagtttag taaaaccaac 26280 

ggtttacgtc tactcgcgtg ttaaaaatct gaactcttct gaaggagttc ctgatcttct 26340 

ggtctaaacg aactaactat tattattatt ctgtttggaa ctttaacatt gcttatcatg 26400 

gcagacaacg gtactattac cgttgaggag cttaaacaac tcctggaaca atggaaccta 26460 

gtaataggtt tcctattcct agcctggatt atgttactac aatttgccta ttctaatcgg 26520 

aacaggtttt tgtacataat aaagcttgtt ttcctctggc tcttgtggcc agtaacactt 26580 

gcttgttttg tgcttgctgc tgtctacaga attaattggg tgactggcgg gattgcgatt 26640 

gcaatggctt gtattgtagg cttgatgtgg cttagctact tcgttgcttc cttcaggctg 26700 

tttgctcgta cccgctcaat gtggtcattc aacccagaaa caaacattct tctcaatgtg 26760 

cctctccggg ggacaattgt gaccagaccg ctcatggaaa gtgaacttgt cattggtgct 26820 

gtgatcattc gtggtcactt gcgaatggcc ggacactccc tagggcgctg tgacattaag 26880 

gacctgccaa aagagatcac tgtggctaca tcacgaacgc tttcttatta caaattagga 26940 

gcgtcgcagc gtgtaggcac tgattcaggt tttgctgcat acaaccgcta ccgtattgga 27000 

aactataaat taaatacaga ccacgccggt agcaacgaca atattgcttt gctagtacag 27060 

taagtgacaa cagatgtttc atcttgttga cttccaggtt acaatagcag agatattgat 27120 

tatcattatg aggactttca ggattgctat ttggaatctt gacgttataa taagttcaat 27180 

agtgagacaa ttatttaagc ctctaactaa gaagaattat tcggagttag atgatgaaga 27240 

acctatggag ttagattatc cataaaacga acatgaaaat tattctcttc ctgacattga 27300 

ttgtatttac atcttgcgag ctatatcact atcaggagtg tgttagaggt acgactgtac 27360 

tactaaaaga accttgccca tcaggaacat acgagggcaa ttcaccattt caccctcttg 27420 

ctgacaataa atttgcacta acttgcacta gcacacactt tgcttttgct tgtgctgacg 27480 
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gtactcgaca tacctatcag ctgcgtgcaa gatcagtttc accaaaactt ttcatcagac 27540 

aagaggaggt tcaacaagag ctctactcgc cactttttct cattgttgct gctctagtat 27600 

ttttaatact ttgcttcacc attaagagaa agacagaatg aatgagctca ctttaattga 27660 

cttctatttg tgctttttag cctttctgct attccttgtt ttaataatgc ttattatatt 27720 

ttggttttca ctcgaaatcc aggatctaga agaaccttgt accaaagtct aaacgaacat 27780 

gaaacttctc attgttttga cttgtatttc tctatgcagt tgcatatgca ctgtagtaca 27840 

gcgctgtgca tctaataaac ctcatgtgct tgaagatcct tgtaaggtac aacactaggg 27900 

gtaatactta tagcactgct tggctttgtg ctctaggaaa ggttttacct tttcatagat 27960 

ggcacactat ggttcaaaca tgcacaccta atgttactat caactgtcaa gatccagctg 28020 

gtggtgcgct tatagctagg tgttggtacc ttcatgaagg tcaccaaact gctgcattta 28080 

gagacgtact tgttgtttta aataaacgaa caaattaaaa tgtctgataa tggaccccaa 28140 

tcaaaccaac gtagtgcccc ccgcattaca tttggtggac ccacagattc aactgacaat 28200 

aaccagaatg gaggacgcaa tggggcaagg ccaaaacagc gccgacccca aggtttaccc 28260 

aataatactg cgtcttggtt cacagctctc actcagcatg gcaaggagga acttagattc 28320 

cctcgaggcc agggcgttcc aatcaacacc aatagtggtc cagatgacca aattggctac 28380 

taccgaagag ctacccgacg agttcgtggt ggtgacggca aaatgaaaga gctcagcccc 28440 

agatggtact tctattacct aggaactggc ccagaagctt cacttcccta cggcgctaac 28500 

aaagaaggca tcgtatgggt tgcaactgag ggagccttga atacacccaa agaccacatt 28560 

ggcacccgca atcctaataa caatgctgcc accgtgctac aacttcctca aggaacaaca 28620 

ttgccaaaag gcttctacgc agagggaagc agaggcggca gtcaagcctc ttctcgctcc 28680 

tcatcacgta gtcgcggtaa ttcaagaaat tcaactcctg gcagcagtag gggaaattct 28740 

cctgctcgaa tggctagcgg aggtggtgaa actgccctcg cgctattgct gctagacaga 28800 

ttgaaccagc ttgagagcaa agtttctggt aaaggccaac aacaacaagg ccaaactgtc 28860 

actaagaaat ctgctgctga ggcatctaaa aagcctcgcc aaaaacgtac tgccacaaaa 28920 

cagtacaacg tcactcaagc atttgggaga cgtggtccag aacaaaccca aggaaatttc 28980 

ggggaccaag acctaatcag acaaggaact gattacaaac attggccgca aattgcacaa 29040 

tttgctccaa gtgcctctgc attctttgga atgtcacgca ttggcatgga agtcacacct 29100 

tcgggaacat ggctgactta tcatggagcc attaaattgg atgacaaaga tccacaattc 29160 

aaagacaacg tcatactgct gaacaagcac attgacgcat acaaaacatt cccaccaaca 29220 

gagcctaaaa aggacaaaaa gaaaaagact gatgaagctc agcctttgcc gcagagacaa 29280 

aagaagcagc ccactgtgac tcttcttcct gcggctgaca tggatgattt ctccagacaa 29340 

cttcaaaatt ccatgagtgg agcttctgct gattcaactc aggcataaac actcatgatg 29400 

accacacaag gcagatgggc tatgtaaacg ttttcgcaat tccgtttacg atacatagtc 29460 

tactcttgtg cagaatgaat tctcgtaact aaacagcaca agtaggttta gttaactttra 29520 
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atctcacata gcaatcttta atcaatgtgt aacattaggg aggacttgaa agagccacca 29580 

cattttcatc gaggccacgc ggagtacgat cgagggtaca gtgaataatg ctagggagag 29640 

ctgcctatat ggaagagccc taatgtgtaa aattaatttt agtagtgcta tccccatgtg 29700 

attttaatag cttcttagga gaatgacaaa aaaaaaaaaa aaaaaa 29746 

<210> 2 

<211> 3945 

<212> DNA 

<213> CORONAVIRUS 

<220> 

<221> CDS 

<222> (89).. (3853) 

<223> 



<400> 2 

ttctcttctg gaaaaaggta ggcttatcat tagagaaaac aacagagttg tggtttcaag 60 

tgatattctt gttaacaact aaacgaac atg ttt att ttc tta tta ttt ctt 112 

Met Phe lie Phe Leu Leu Phe Leu 
1 5 

act etc act agt gqt agt gac ctt gac egg tgc acc act ttt gat gat 160 
Thr Leu Thr Ser Gly Ser Asp Leu Asp Arg Cys Thr Thr Phe Asp Asp 
10 15 20 

gtt caa get cct aat tac act caa cat act tea tct atg agg ggg gtt 208 
Val Gin Ala Pro Asn Tyr Thr Gin His Thr Ser ser Met Arg Gly Val 
25 30 35 40 

tac tat cct gat gaa att ttt aga tea gac act ctt tat tta act cag 256 
Tyr Tyr Pro Asp Glu lie Phe Arg Ser Asp Thr Leu Tyr Leu Thr Gin 
45 50 55 

gat tta ttt ctt cca ttt tat tct aat gtt aca ggg ttt cat act att 304 
Asp Leu Phe Leu Pro Phe Tyr ser Asn Val Thr Gly Phe His Thr lie 
60 65 70 

aat cat acg ttt gqc aac cct gtc ata cct ttt aag gat gqt att tat 352 
Asn His Thr Phe Gly Asn Pro val lie Pro Phe Lys Asp Gly lie Tyr 
75 80 85 

ttt get gee aca gag aaa tea aat gtt gtc cgt gqt tgg gtt ttt ggt 400 
Phe Ala Ala Thr Glu Lys Ser Asn val val Arg Gly Trp val Phe Gly 
90 95 100 

tct acc atg aac aac aag tea cag teg gtq att att att aac aat tct 448 
Ser Thr Met Asn Asn Lys Ser Gin Ser Val lie lie lie Asn Asn ser 
105 110 115 120 

act aat gtt gtt ata cga gca tgt aac ttt gaa ttg tgt gac aac cct 496 

Thr Asn val val lie Arg Ala cys Asn Phe Glu Leu cys Asp Asn Pro 
125 130 135 
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■etc ttt act gtt tct aaa ccc atg ggt aca cag aca cat act atg ata 

Phe Phe Ala val ser Lys Pro Met Gly Thr Gin Thr His Thr Met lie 
140 145 150 

ttc qat aat gca ttt aat tgc act ttc gag tac ata tct gat gec ttt 

Phe Asp Asn Ala Phe Asn Cys Thr Phe Glu Tyr He Ser Asp Ala Phe 
155 160 165 

teg ctt gat gtt tea gaa aag tea ggt aat ttt aaa cac tta cga gag 

ser Leu asp val Ser Glu Lys ser Gly Asn Phe Lys His Leu Arg Glu 
170 175 180 



544 



592 



640 



c tat 688 
r 



ttt gtg ttt aaa aat aaa gat ggg ttt etc tat gtt tat aag ggc ta 
Phe val Phe Lys Asn Lys Asp Gly Phe Leu Tyr Val Tyr Lys Gly Ty 
185 190 195 200 

caa cct ata gat gta gtt cgt gat eta cct tct ggt ttt aac act ttg 
Gin Pro lie Asp val val Arg Asp Leu Pro Ser Gly Phe Asn Thr Leu 
205 210 215 

aaa cct att ttt aag ttg cct ctt ggt att aac att aca aat ttt aga 
Lys Pro lie Phe Lys Leu pro Leu Gly He Asn lie Thr Asn Phe Arg 
220 225 230 

gee att ctt aca gee ttt tea cct get caa gac att tgg ggc acg tea 
Ala He Leu Thr Ala Phe ser Pro Ala Gin Asp lie Trp Gly Thr Ser 
235 240 245 

act gca gec tat ttt gtt ggc tat tta aag cca act aca ttt atg etc 880 
Ala Ala Ala Tyr Phe val Gly Tyr Leu Lys Pro Thr Thr Phe Met Leu 
250 255 260 

aag tat gat gaa aat ggt aca ate aca gat get gtt gat tgt tct caa 
Lys Tyr Asp Glu Asn Gly Thr lie Thr Asp Ala val Asp cys ser Gin 
265 270 275 280 



736 



784 



832 



928 



aat cca ctt get gaa etc aaa tgc tct gtt aag age ttt gag att gac 976 ~, 

Asn Pro Leu Ala Glu Leu Lys cys Ser val Lys ser Phe Glu lie Asp - 
285 290 295 

aaa gga att tac cag ace tct aat ttc agg gtt gtt ccc tea gga gat 1024 
Lys Gly lie Tyr Gin Thr Ser Asn Phe Arg val val Pro ser Gly Asp 
300 305 310 

gtt gtg aga ttc cct aat att aca aac ttg tgt cct ttt gga gag gtt 1072 
Val val Arg Phe Pro Asn lie Thr Asn Leu cys Pro Phe Gly Glu val 
315 320 325 

ttt aat get act aaa ttc cct tct gtc tat gca tgg gag aga aaa aaa 1120 
Phe Asn Ala Thr Lys Phe Pro Ser Val Tyr Ala Trp Glu Arg Lys Lys 
330 335 340 

att tct aat tgt gtt get gat tac tct gtg etc tac aac tea aca ttt 
He Ser Asn cys val Ala Asp Tyr Ser val Leu Tyr Asn ser Thr Phe 
345 350 355 360 

ttt tea ace ttt aag tgc tat ggc gtt tct gec act aag ttg aat gat 
Phe Ser Thr Phe Lys cys Tyr Gly Val Ser Ala Thr Lys Leu Asn Asp 
365 370 375 

ctt tgc ttc tec aat gtc tat gca gat tct ttt gta gtc aag gga gat 
Leu cys Phe ser Asn Val Tyr Ala Asp Ser Phe Val Val Lys Gly Asp 
380 385 390 

gat gta aga caa ata gcg cca gga caa act ggt gtt att get gat tat 
Asp val Arg Gin lie Ala Pro Gly Gin Thr Gly val lie Ala Asp Tyr 
395 400 405 
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aat tat aaa ttg cca gat gat ttc atg ggt tgt gtc ctt get tgg aat 1360 
Asn Tyr Lys Leu Pro Asp Asp Phe Met Gly Cys val Leu Ala Trp Asn 
410 415 420 

act agg aac att gat get act tea act ggt aat tat aat tat aaa tat 1408 
Thr Arg Asn He Asp Ala Thr Ser Thr Gly Asn Tyr Asn Tyr Lys Tyr 
425 430 435 440 



agg tat ctt aga cat ggc aag ctt agg ccc ttt gag aga gac ata tct 
Arg Tyr Leu Arg His Gly Lys Leu Arg Pro Phe Glu Arg Asp lie Ser 
445 450 455 

aat gtg cct ttc tec cct gat ggc aaa cct tgc ace cca cct get ctt 
Asn val Pro Phe Ser Pro Asp Gly Lys Pro Cys Thr pro Pro Ala Leu 
460 465 470 



gtg tta act cct tct tea aag aga ttt caa cca ttt caa caa ttt ggc 
vat Leu Thr Pro Ser Ser Lys Arg Phe Gin Pro Phe Gin Gin Phe Gly 
540 545 550 



Pro Ala Trp Arg lie Tyr Ser Thr Gly Asn Asn Val Phe Gin Thr Gin 
620 625 630 

gca ggc tgt ctt ata gga get gag cat gtc gac act tct tat gag tgc 

Ala Gly cys Leu lie Gly Ala Glu His Val Asp Thr Ser Tyr Glu Cys 

635 640 645 



1456. 



1504 



aat tgt tat tgg cca tta aat gat tat ggt ttt tac ace act act ggc 1552 

Asn cys Tyr Trp Pro Leu Asn Asp Tyr Gly Phe Tyr Thr Thr Thr Gly 

475 480 485 

att ggc tac caa cct tac aga gtt gta gta ctt tct ttt gaa ctt tta 1600 

lie Gly Tyr Gin Pro Tyr Arg val val val Leu ser Phe Glu Leu Leu 
490 495 500 

aat gca ccg gec acg gtt tgt gga cca aaa tta tec act gac ctt att 1648 

Asn Ala Pro Ala Thr val cys Gly Pro Lys Leu ser Thr Asp Leu lie 
505 510 515 520 

aag aac cag tgt gtc aat ttt aat ttt aat gga etc act ggt act ggt 1696 
Lys Asn Gin cys val Asn Phe Asn Phe Asn Gly Leu Thr Gly Thr Gly 
525 530 535 



1744 



cgt gat gtt tct gat ttc act gat tec gtt cga gat cct aaa aca tct 1792 

Arg Asp Val ser Asp Phe Thr Asp ser val Arg Asp Pro Lys Thr ser 

555 560 565 

gaa ata tta gac att tea cct tgc tct ttt ggg ggt gta agt gta att 1840 

Glu lie Leu Asp lie Ser Pro Cys ser Phe Gly Gly Val Ser Val lie 

570 575 580 

aca cct gga aca aat get tea tct gaa gtt get gtt eta tat caa gat 1888 

Thr Pro Gly Thr Asn Ala ser Ser Glu Val Ala val Leu Tyr Gin Asp 

585 590 595 600 

gtt aac tgc act gat gtt tct aca gca att cat gca gat caa etc aca 1936 

val Asn Cys Thr Asp Val Ser Thr Ala lie His Ala Asp Gin Leu Thr 

605 610 615 

cca get tgg cgc ata tat tct act gga aac aat gta ttc cag act caa 1984 



2032 



gac att cct att gga get ggc att tgt get agt tac cat aca gtt tct 2080 

Asp lie Pro lie Gly Ala Gly lie cys Ala ser Tyr His Thr val ser 

650 655 660 

tta tta cgt agt act age caa aaa tct att gtg get tat act atg tct 2128 

Leu Leu Arg Ser Thr ser Gin Lys Ser lie val Ala Tyr Thr Met ser 

665 " 670 675 680 
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2176 



2224 



tta ggt get gat agt tea att get tac tct aat aac acc att get ata 
Leu Gly Ala Asp ser Ser lie Ala Tyr Sen Asn Asn Thr He Ala lie 

cct act aac ttt tea att age att act aca gaa gta atg cct gtt tct 
pro Thr Asn Phe ser He ser He Thr Thr Glu val Met Pro val ser 
700 705 710 

ata act aaa acc tec gta gat tgt aat atg tac ate tgc gga gat tct 2272 
Met Ala Lys Thr Ser val Asp cys Asn Met Tyr lie cys Gly Asp Ser 
715 720 725 



2320 



2368 



act gaa tgt get aat ttg ctt etc caa tat ggt age ttt tgc aca caa 
Thr Glu cys Ala Asn Leu Leu Leu Gin Tyr Gly ser Phe Cys Thr Gin 
730 735 740 

eta aat cgt gca etc tea ggt att get get gaa cag gat cgc aac aca 
Leu Asn Arg Ala Leu ser Gly He Ala Ala Glu Gin Asp Arg Asn Thr 
745 "750 755 

cat aaa gtg ttc get caa gtc aaa caa atg tac aaa acc cca act ttg 2416 
Arg Glu vaT Phe Ala Gin val Lys Gin Met Tyr Lys Thr pro Thr Leu 
3 765 770 775 

aaa tat ttt ggt ggt ttt aat ttt tea caa ata tta cct gac cct eta 
Lys Tyr Phe Gly Gly Phe Asn Phe ser Gin He Leu Pro Asp pro Leu 
780 785 790 

aag cca act aag agg tct ttt att gag gac ttg etc ttt aat aag gtg 
Lys Pro Thr Lys Arg Ser Phe lie Glu Asp Leu Leu Phe Asn Lys val 
795 ~ 800 805 

aca etc get gat get ggc ttc atg aag caa tat ggc gaa tgc eta ggt 
Thr Leu Ala Asp Ala Gly Phe Met Lys Gin Tyr Gly Glu Cys Leu Gly 
810 815 820 

qat att aat get aga gat etc att tgt gcg cag aag ttc aat gga ctt 
Asp lie Asn Ala Arg Asp Leu He Cys Ala Gin Lys Phe Asn Gly Leu 
825 830 835 840 

aca gtg ttg cca cct ctg etc act gat gat atg att get gee tac act 
Thr Val Leu Pro Pro Leu Leu Thr Asp Asp Met lie Ala Ala Tyr Thr 
845 850 855 

get get eta gtt agt ggt act gec act get gga tgg aca ttt ggt get 
Ala Ala Leu val Ser Gly Thr Ala Thr Ala Gly Trp Thr Phe Gly Ala 
860 865 870 

qqc get get ctt caa ata cct ttt get atg caa atg gca tat agg ttc 
Gly Ala Ala Leu Gin lie Pro Phe Ala Met Gin Met Ala Tyr Arg Phe 
875 880 885 

aat ggc att gga gtt acc caa aat gtt etc tat gag aac caa aaa caa 
Asn Gly lie Gly val Thr Gin Asn val Leu Tyr Glu Asn Gin Lys Gin 
890 895 900 

ate gec aac caa ttt aac aag gcg att agt caa att caa gaa tea ctt 
He Ala Asn Gin Phe Asn Lys Ala lie ser Gin lie Gin Glu ser Leu 
905 910 915 920 

aca aca aca tea act gca ttg ggc aag ctg caa gac gtt gtt aac cag 
Thr Thr Thr Ser Thr Ala Leu Gly Lys Leu Gin Asp Val val Asn Gin 
925 930 935 

aat get caa gca tta aac aca ctt gtt aaa caa ctt age tct aat ttt 
Asn Ala Gin Ala Leu Asn Thr Leu Val Lys Gin Leu ser ser Asn Phe 
940 945 950 
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2800 



2848 



2896 
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ggt gca att tea agt gtg eta aat gat ate ctt teg cga ctt gat aaa 2992 
Gly Ala lie Ser ser val Leu Asn Asp lie Leu Ser Arg Leu Asp Lys 
955 960 965 



gtc gag gcg gag gta caa att gac agg tta att aca ggc aga ctt caa 
val Glu Ala Glu Val Gin lie Asp Arg Leu lie Thr Gly Arg Leu Gin 
970 975 980 



3040 



age ctt caa ace tat gta aca caa caa eta ate agg get get gaa ate 3088 
ser Leu Gin Thr Tyr Val Thr Gin Gin Leu He Arg Ala Ala Glu He 
985 990 995 1000 

agg get tct get aat ctt get get act aaa atg tct gag tgt gtt 3133 
Arg Ala Ser Ala Asn Leu Ala Ala Thr Lys Met Ser Glu cys val 
1005 1010 1015 

ctt gga caa tea aaa aga gtt gac ttt tgt gga aag ggc tac cac 3178 
Leu Gly Gin ser Lys Arg Val Asp Phe Cys Gly Lys Gly Tyr His 
1020 1025 1030 

ctt atg tec ttc cca caa gca gee ccg cat ggt gtt gtc ttc eta 3223 
Leu Met Ser Phe Pro Gin Ala Ala Pro His Gly Val Val Phe Leu 
1035 1040 1045 

cat gtc acg tat gtq cca tec cag gag agg aac ttc acc aca gcg 3268 
His val Thr Tyr val Pro ser Gin Glu Arg Asn Phe Thr Thr Ala 
1050 1055 1060 

cca gca att tgt cat gaa ggc aaa gca tac ttc cct cgt gaa ggt 3313 
Pro Ala lie Cys His Glu Gly Lys Ala Tyr Phe Pro Arg Glu Gly 
1065 1070 1075 

gtt ttt gtq ttt aat ggc act tct tgg ttt att aca cag agg aac 3358 
val Phe val Phe Asn Gly Thr ser Trp phe He Thr Gin Arg Asn 
1080 1085 1090 

ttc ttt tct cca caa ata att act aca gac aat aca ttt gtc tea 3403 
Phe Phe ser Pro Gin lie lie Thr Thr Asp Asn Thr Phe val Ser 
1095 1100 1105 

gga aat tgt gat gtc gtt att ggc ate att aac aac aca gtt tat 3448 
Gly Asn cys Asp val Val He Gly lie lie Asn Asn Thr val Tyr 
1110 1115 1120 

gat cct ctg caa cct gag ctt gac tea ttc aaa gaa gag ctg gac 3493 
Asp Pro Leu Gin Pro Glu Leu Asp Ser phe Lys Glu Glu Leu Asp 
1125 1130 1135 

aag tac ttc aaa aat cat aca tea cca gat gtt gat ctt ggc gac 3538 
Lys Tyr Phe Lys Asn His Thr ser Pro Asp Val Asp Leu Gly Asp 
1140 1145 1150 

att tea ggc att aac get tct gtc gtc aac att caa aaa gaa att 3583 
He ser Gly lie Asn Ala ser Val Val Asn lie Gin Lys Glu lie 
1155 1160 1165 

gac cgc etc aat gag gtc get aaa aat tta aat gaa tea etc att 3628 
Asp Arg Leu Asn Glu val Ala Lys Asn Leu Asn Glu Ser Leu lie 
1170 1175 1180 

gac ctt caa gaa ttg gga aaa tat gag caa tat att aaa tgg cct 3673 
Asp Leu Gin Glu Leu Gly Lys Tyr Glu Gin Tyr lie Lys Trp Pro 
1185 1190 1195 

tgg tat gtt tgg etc ggc ttc att get gga eta att gee ate gtc 3718 
Trp Tyr val Trp Leu Gly phe lie Ala Gly Leu lie Ala lie Val 
1200 1205 1210 

Page 20 



I W» V< <^ Jk^ w ». 



S226CAS108.ST25 

atg gtt aca ate ttg ctt tgt tgc atg act agt tgt tgc agt tgc 
Met val Thr lie Leu Leu Cys cys Met Thr Ser cys cys ser cys 
X215 xz 

25 SI lf y K £ IS SJ W £ § 5 3S "I S BS § 0 
S BS S S8 f4 8H £2 SI »5 1| 0 K E SB 5? SS 

taaacgaact tatggatttg tttatgagat tttttactct tggatcaatt actgcacagc 
cagtaaaaat tgacaatget tctcctgcaa gt 

<210> 3 

<211> 1255 

<212> PRT 

<213> CORONAVIRUS 

<400> 3 

Met Phe He Phe Leu Leu Phe Leu Thr Leu Thr Ser Gly Ser Asp . Leu 

1 5 10 J-3 

Asp Arg cys Thr Thr Phe Asp Asp val Gin Ala Pro Asn Tyr Thr Gin 
20 25 3U 

His Thr ser ser Met Arg Gly Val Tyr Tyr Pro Asp Glu He Phe Arg 
35 40 ^ 

ser Asp Thr Leu Tyr Leu Thr Gin Asp Leu Phe Leu Pro Phe Tyr Ser 
50 55 w 

Asn val Thr Gly Phe His Thr lie Asn His Thr Phe Gly Asn Pro val 
65 70 

He pro Phe Lys Asp Gly lie Tyr Phe Ala Ala Thr Glu Lys Ser Asn 

val val Arg Gly Trp val Phe Gly ser Thr Met Asn Asn Lys Ser Gin 
100 105 J -- LU 

Ser val lie lie He Asn Asn Ser Thr Asn Val val lie Arg Ala Cys 
115 120 

Asn Phe Glu Leu Cys Asp Asn Pro Phe Phe Ala Val Ser Lys Pro Met 
130 135 • L4U 

Glv Thr Gin Thr His Thr Met lie Phe Asp Asn Ala Phe Asn cys Thr 
l 4 t 150 155 160 
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Phe Glu Tyr lie Ser Asp Ala Phe ser Leu Asp Val Ser Glu Lys Ser 
165 170 175 

Gly Asn Phe Lys His Leu Arg Glu Phe Val Phe Lys Asn Lys Asp Gly 
180 185 190 

Phe Leu Tyr val Tyr Lys Gly Tyr Gin Pro lie Asp Val Val Arg Asp 
195 200 205 

Leu Pro Ser Gly Phe Asn Thr Leu Lys Pro lie Phe Lys Leu Pro Leu 
210 215 220 

Gly lie Asn lie Thr Asn Phe Arg Ala lie Leu Thr Ala Phe Ser Pro 
225 230 235 240 

Ala Gin Asp lie Trp Gly Thr Ser Ala Ala Ala Tyr Phe val Gly Tyr 
245 250 255 

Leu Lys Pro Thr Thr Phe Met Leu Lys Tyr Asp Glu Asn Gly Thr lie 
260 265 270 

Thr Asp Ala val Asp cys ser Gin Asn Pro Leu Ala Glu Leu Lys Cys 
275 280 285 

Ser Val Lys ser Phe Glu lie Asp Lys Gly lie Tyr Gin Thr ser Asn 
290 295 300 

Phe Arg val val Pro Ser Gly Asp val val Arg Phe Pro Asn lie Thr 
305 310 315 320 

Asn Leu cys Pro Phe Gly Glu Val Phe Asn Ala Thr Lys Phe Pro Ser 
325 330 335 

Val Tyr Ala Trp Glu Arg Lys Lys lie Ser Asn Cys Val Ala Asp Tyr 
340 345 350 

Ser val Leu Tyr Asn Ser Thr Phe Phe Ser Thr Phe Lys Cys Tyr Gly 
355 360 365 

val Ser Ala Thr Lys Leu Asn Asp Leu Cys Phe ser Asn val Tyr Ala 
370 375 380 

Asp Ser Phe Val Val Lys Gly Asp Asp Val Arg Gin lie Ala Pro Gly 
385 390 395 400 

Gin Thr Gly val lie Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe 
405 410 415 

Met Gly cys Val Leu Ala Trp Asn Thr Arg Asn lie Asp Ala Thr ser 
420 425 "' 430 
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Thr Gly Asn Tyr Asn Tyr Lys Tyr Arg Tyr Leu Arg His Gly Lys Leu 
435 440 445 

Arg Pro Phe Glu Arg Asp lie Ser Asn Val Pro Phe ser Pro Asp Gly 
450 455 460 

Lys Pro cys Thr Pro Pro Ala Leu Asn Cys Tyr Trp Pro Leu Asn Asp 
4&5 470 475 480 

Tyr Gly Phe Tyr Thr Thr Thr Gly lie Gly Tyr Gin Pro Tyr Arg val 
1 3 485 490 495 

Val val Leu ser Phe Glu Leu Leu Asn Ala Pro Ala Thr val cys Gly 
500 505 510 

pro Lys Leu Ser Thr Asp Leu lie Lys Asn Gin Cys Val Asn Phe Asn 
515 520 525 

Phe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Pro Ser ser Lys Arg 
530 535 540 

Phe Gin Pro Phe Gin Gin Phe Gly Arg Asp val Ser Asp Phe Thr Asp 
545 550 555 560 

ser Val Arg Asp Pro Lys Thr ser Glu lie Leu Asp lie Ser Pro Cys 
565 570 575 

Ser Phe Gly Gly val ser val lie Thr Pro Gly Thr Asn Ala Ser Ser 
580 585 590 

Glu Val Ala val Leu Tyr Gin Asp Val Asn Cys Thr Asp val ser Thr 
595 600 605 

Ala He His Ala Asp Gin Leu Thr Pro Ala Trp Arg lie Tyr ser Thr 
610 615 620 

Gly Asn Asn val Phe Gin Thr Gin Ala Gly Cys Leu lie Gly Ala Glu 
625 630 635 640 

His Val Asp Thr ser Tyr Glu Cys Asp He Pro lie Gly Ala Gly lie 
645 650 655 

Cys Ala ser Tyr His Thr Val Ser Leu Leu Arg Ser Thr ser Gin Lys 
660 665 670 

ser lie val Ala Tyr Thr Met Ser Leu Gly Ala Asp ser ser lie Ala 
675 680 685 

Tyr ser Asn Asn Thr lie Ala lie Pro Thr Asn Phe Ser lie Ser lie 
690 695 700 
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Thr Thr Glu val Met Pro Val Ser Met Ala Lys Thr Ser Val Asp Cys 
705 710 715 720 

Asn Met Tyr lie cys Gly Asp Ser Thr Glu Cys Ala Asn Leu Leu Leu 
725 730 735 

Gin Tyr Gly ser Phe Cys Thr Gin Leu Asn Arg Ala Leu Ser Gly He 
740 745 750 

Ala Ala Glu Gin Asp Arg Asn Thr Arg Glu Val Phe Ala Gin val Lys 
755 760 765 

Gin Met Tyr Lys Thr Pro Thr Leu Lys Tyr Phe Gly Gly Phe Asn Phe 
770 775 780 

Ser Gin He Leu Pro Asp Pro Leu Lys Pro Thr Lys Arg Ser Phe lie 
785 790 795 800 

Glu Asp Leu Leu Phe Asn Lys val Thr Leu Ala Asp Ala Gly Phe Met 
805 810 815 

Lys Gin Tyr Gly Glu Cys Leu Gly Asp lie Asn Ala Arg Asp Leu lie 
820 825 830 

cys Ala Gin Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu Leu Thr 
835 840 845 

Asp Asp Met lie Ala Ala Tyr Thr Ala Ala Leu Val ser Gly Thr Ala 
850 855 860 

Thr Ala Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gin lie Pro Phe 
865 870 875 880 

Ala Met Gin Met Ala Tyr Arg Phe Asn Gly lie Gly val Thr Gin Asn 
885 ~ 890 895 

Val Leu Tyr Glu Asn Gin Lys Gin lie Ala Asn Gin Phe Asn Lys Ala 
900 905 910 

lie Ser Gin lie Gin Glu ser Leu Thr Thr Thr Ser Thr Ala Leu Gly 
915 920 925 

Lys Leu Gin Asp Val Val Asn Gin Asn Ala Gin Ala Leu Asn Thr Leu 
930 935 940 

Val Lys Gin Leu Ser ser Asn Phe Gly Ala lie Ser ser Val Leu Asn 
945 950 955 960 

Asp He Leu ser Arg Leu Asp Lys val Glu Ala Glu val Gin lie Asp 
965 970 975 
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Arg Leu He Thr Gly Arg Leu Gin ser Leu Gin Thr Tyr val Thr Gin 
980 985 

Gin Leu He Arg Ala Ala Glu lie Arg Ala ser Ala Asn Leu Ala Ala 
995 1000 xvyj i 

Thr Lys Met ser Glu cys Val Leu Gly Gin ser Lys Arg val Asp 
1010 1015 l° zu 

Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gin Ala Ala 
1025 1° 30 

Pro His Gly val val Phe Leu His Val Thr Tyr val Pro Ser Gin 
1040 1° 45 xu:> 

Glu Arg Asn Phe Thr Thr Ala Pro Ala He Cys His Glu Gly Lys 
1055 1060 1065 

Ala Tyr Phe Pro Arg Glu Gly p val Phe val Phe Asn Gly Thr Ser 
1070 1075 1080 

Trp Phe lie Thr Gin Arg Asn Phe Phe Ser Pro Gin He He Thr 
1085 1090 lOab 

Thr Asp Asn Thr Phe val ser Gly Asn cys Asp val val lie Gly 
1100 1105 mo 

He lie Asn Asn Thr Val Tyr Asp Pro Leu Gin Pro Glu Leu Asp 
1115 1120 -Li" 

ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn His Thr ser 
1130 1135 1140 

pro Asp val Asp Leu Gly Asp^ He Ser Gly He Asn Ala ser val 
1145 1150 x±» 

val Asn He Gin Lys Glu He Asp Arg Leu Asn Glu val Ala Lys 
1160 1165 H'° 

Asn Leu Asn Glu Ser Leu lie Asp Leu Gin Glu Leu Gly Lys Tyr 
H75 1180 llo^ 

Glu Gin Tyr He Lys Trp Pro Trp Tyr val Trp Leu Gly Phe He 
1190 119 5 xzvv 

Ala Gly Leu lie Ala He val Met val Thr He Leu Leu cys cys 
1 7ns 1210 J-*- 1 --* 



1205 

Met Thr ser cys Cys Ser cys^ Leu Lys Gly Ala CyS Q Ser cys Gly 
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Ser Cys cys Lys Phe Asp Glu Asp Asp Ser Glu Pro val Leu Lys 
1235 1240 1245 

Gly val Lys Leu His Tyr Thr 
1250 1255 

<210> 4 

<211> 3943 

<212> DNA 

<213> CORONAVIRUS 

<400> 4 

ctcttctgga aaaaggtagg cttatcatta gagaaaacaa cagagttgtg gtttcaagtg 60 

atattcttgt taacaactaa acgaacatgt ttattttctt attatttctt actctcacta 120 

gtggtagtga ccttgaccgg tgcaccactt ttgatgatgt tcaagctcct aattacactc 180 

aacatacttc atctatgagg ggggtttact atcctgatga aatttttaga tcagacactc 240 

tttatttaac tcaggattta tttcttccat tttattctaa tgttacaggg tttcatacta 300 

ttaatcatac gtttggcaac cctgtcatac cttttaagga tggtatttat tttgctgcca 360 

cagagaaatc aaatgttgtc cgtggttggg tttttggttc taccatgaac aacaagtcac 420 

agtcggtgat tattattaac aattctacta atgttgttat acgagcatgt aactttgaat 480 

tgtgtgacaa ccctttcttt gctgtttcta aacccatggg tacacagaca catactatga 540 

tattcgataa tgcatttaat tgcactttcg agtacatatc tgatgccttt tcgcttgatg 600 

tttcagaaaa gtcaggtaat tttaaacact tacgagagtt tgtgtttaaa aataaagatg 660 

ggtttctcta tgtttataag ggctatcaac ctatagatgt agttcgtgat ctaccttctg 720 

gttttaacac turtgaaacct atrttttaagt tgcctcttgg tartaacatt acaaatttta 780 

gagccattct tacagccttt tcacctgctc aagacatttg gggcacgtca gctgcagcct 840 

attttgttgg ctatttaaag ccaactacat ttatgctcaa gtatgatgaa aatggtacaa 900 

tcacagatgc tgttgattgt tctcaaaatc cacttgctga actcaaatgc tctgttaaga 960 

gctttgagat tgacaaagga atttaccaga cctctaattt cagggttgtt ccctcaggag 1020 

atgttgtgag attccctaat attacaaact tgtgtccttt tggagaggtt tttaatgcta 1080 

ctaaattccc ttctgtctat gcatgggaga gaaaaaaaat ttctaattgt gttgctgatt 1140 

actctgtgct ctacaactca acattttttt caacctttaa gtgctatggc gtttctgcca 1200 

ctaagttgaa tgatctttgc ttctccaatg tctatgcaga ttcttttgta gtcaagggag 1260 

atgatgtaag acaaatagcg ccaggacaaa ctggtgttat tgctgattat aattataaat 1320 

tgccagatga tttcatgggt tigtgtccttg cttggaatac taggaacatt gatgctactt 1380 

caactggtaa ttataattat aaatataggt atcttagaca tggcaagctt aggccctttg 1440 
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agagagacat 


atctaatgtg 


cctttctccc 


ttaattgtta 


ttggccatta 


aatgattatg 


aaccttacag 


agttgtagta 


ctttcttttg 


gaccaaaatt 


atccactgac 


cttattaaga 


tcactggtac 


tggtgtgtta 


actccttctt 


gccgtgatgt 


ctctgatttc 


actgattccg 


acatttcacc 


ttgctctttt 


gggggtgtaa 


ctgaagttgc 


tgttctatat 


caagatgtta 


cagatcaact 


cacaccagct 


tggcgcatat 


aagcaggctg 


tcttatagga 


gctgagcatg 


ttggagctgg 


catttgtgct 


agttaccata 


aatctattgt 


ggcttatact 


atgtctttag 


acaccattgc 


tatacctact 


aacttttcaa 


ctatggctaa 


aacctccgta 


gattgtaata 


ctaatttgct 


tctccaatat 


ggtagctttt 


ttgctgctga 


acaggatcgc 


aacacacgtg 


aaaccccaac 


tttgaaatat 


tttggtggtt 


taaagccaac 


taagaggtct 


tttattgagg 


atgctggctt 


catgaagcaa 


tatggcgaat 


tttgtgcgca 


gaagttcaat 


gggcttacag 


ttgctgccta 


cactgctgct 


ctagttagtg 


ctggcgctgc 


tcttcaaata 


ccttttgcta 


gagttaccca 


aaatgttctc 


tatgagaacc 


cgattagtca 


aattcaagaa 


tcacttacaa 


acgttgttaa 


ccagaatgct 


caagcattaa 


ttggtgcaat 


ttcaagtgtg 


ctaaatgata 


aggtacaaat 


tgacaggcta 


attacaggca 


aacaactaat 


cagggctgct 


gaaatcaggg 


ctgagtgtgt 


tcttggacaa 


tcaaaaagag 


tgtccttccc 


acaagcagcc 


ccgcatggtg 


cccaggagag 


gaacttcacc 


acagcgccag 


ctcgtgaagg 


tgtttttgtg 


tttaatggca 


tttctccaca 


aataattact 


acagacaata 


ttggcatcat 


taacaacaca 


gtttatgatc 



1er depot 
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ctgatggcaa accttgcacc 


ccacctgctc 


1500 


gtttttacac cactactggc 


attggctacc 


1560 


aacttttaaa tgcaccggcc 


acggtttgtg 


1620 


accagtgtgt caattttaat 


tttaatggac 


1680 


caaagagatt tcaaccattt 


caacaatttg 


1740 


ttcgagatcc taaaacatct 


gaaatattag 


1800 


gtgtaattac acctggaaca 


aatgcttcat 


1860 


actgcactga tgtttctaca 


gcaatccatg 


1920 


attctactgg aaacaatgta 


ttccagactc 


1980 


tcgacacttc ttatgagtgc 


gacattccta 


2040 


cagtttcttt attacgtagt 


actagccaaa 


2100 


gtgctgatag ttcaattgct 


tactctaata 


2160 


ttagcattac tacagaagta 


atgcctgttt 


2220 


tgtacatctg cggagattct 


actgaatgtg 


2280 


gcacacaact aaatcgtgca 


ctctcaggta 


2340 


aagtgttcgc tcaagtcaaa 


caaatgtaca 


2400 


ttaatttttc acaaatatta 


cctgaccctc 


2460 


acttgctctt taataaggtg 


acactcgctg 


2520 


gcctaggtga tattaatgct 


agagatctca 


2580 


tgrtgccacc tctgctcact 


gatgatatga 


2640 


gtactgccac tgctggatgg 


acattrggtg 


2700 


tgcaaatggc atataggttc 


aatggcattg 


2760 


aaaaacaaat cgccaaccaa 


tttaacaagg 


2820 


caacatcaac tgcattgggc 


aagctgcaag 


2880 


acacacttgt taaacaactt 


agctctaatt 


2940 


tcctttcgcg acttgataaa 


gtcgaggcgg 


3000 


gacttcaaag ccttcaaacc 


tatgtaacac 


3060 


cttctgctaa tcttgctgct 


actaaaatgt 


3120 


ttgacttttg "tggaaagggc 


taccacctta 


3180 


ttgtcttcct acatgtcacg 


tatgtgccat 


3240 


caatttgtca tgaaggcaaa 


gcatacttcc 


3300 


cttcttggtt tattacacag 


aggaacttct 


3360 


catttgtctc aggaaattgt 


gatgtcgtta 


3420 


ctctgcaacc tgagcttgac 


tcattcaaag 


3480 
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aagagctgga caagtacttc aaaaatcata 
caggcattaa cgcttctgtc gtcaacattc 
ctaaaaattt aaatgaatca ctcattgacc 
ttaaatggcc ttggtatgtt tggctcggct 
ttacaatctt gctttgttgc atgactagtt 
gtggttcttg ctgcaagttt gatgaggatg 
tacattacac ataaacgaac ttatggattt 
tactgcacag ccagtaaaaa ttgacaatgc 

<210> 5 

<211> 2049 

<212> DNA 

<213> CORONAVIRUS 



S226CAS108. 

catcaccaga 

aaaaagaaat 

ttcaagaatt 

tcattgctgg 

gttgcagttg 

actctgagcc 

gtttatgaga 

ttctcctgca 



ST25 

tgttgatctt 
tgaccgcctc 
gggaaaatat 
actaattgcc 
cctcaagggt 
agttctcaag 
ttttttactc 
agt 



ggcgacattt 
aatgaggtcg 
gagcaatata 
atcgtcatgg 
gcatgctctt 
ggtgtcaaat 
ttggatcaat 



3540 
3600 
3660 
3720 
3780 
3840 
3900 
3943 



<400> 5 
ctcttctgga 



atattcttgt 
gtggtagtga 
aacatacttc 
tttatttaac 
ttaatcatac 
cagagaaatc 
agtcggtgat 
tgtgtgacaa 
tattcgataa 
tttcagaaaa 
ggtttctcta 
gttttaacac 
gagccattct 
attttgttgg 
tcacagatgc. 
gctttgagat 
atgttgtgag 
ctaaattccc 
actctgtgct 



aaaaggtagg 
taacaactaa 
ccttgaccgg 
atctatgagg 
tcaggattta 
gtttggcaac 
aaatgttgtc 
tattattaac 
ccctttcttt 
tgcatttaat 
gtcaggtaat 
tgtttataag 
tttgaaacct 
tacagccttt 
ctatttaaag 
tgttgattgt 
tgacaaagga 
attccctaat 
ttctgtctat 
ctacaactca 



cttatcatta 
acgaacatgt 
tgcaccactt 

ggggtttact 

tttcttccat 
cctgtcatac 
cgtggttggg 
aattctacta 
gctgtttcta 
tgcactttcg 
tttaaacact 
ggctatcaac 
atttttaagt 
tcacctgctc 
ccaactacat 
tctcaaaatc 
atttaccaga 
attacaaact 
gcatgggaga 
acattttttt 



gagaaaacaa 
ttattttctt 
ttgatgatgt 
atcctgatga 
tttattctaa 
cttttaagga 
tttttggttc 
atgttgttat 
aacccatggg 
agtacatatc 
tacgagagtt 
ctatagatgt 
tgcctcttgg 
aagacatttg 
ttatgctcaa 
cacttgctga 
cctctaattt 
tgtgtccttt 
gaaaaaaaat 



caacctttaa 
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cagagttgtg 
attatttctt 
teaagctcct 
aatttttaga 
tgttacaggg 
tggtatttat 
taccatgaac 
acgagcatgt 
tacacagaca 
tgatgccttt 
tgtgtttaaa 
agttcgtgat 
tattaacatt 
gggcacgtca 
gtatgatgaa 
actcaaatgc 
cagggttgtt 
tggagaggtt 
ttctaattgt 
gtgctatggc 



gtttcaagtg 
actctcacta 
aattacactc 
tcagacactc 
tttcatacta 
tttgctgcca 
aacaagtcac 
aactttgaat 
catactatga 
tcgcttgatg 
aataaagatg 
ctaccttctg 
acaaatttta 
gctgcagcct 
aatggtacaa 
tctgttaaga 
ccctcaggag 
tttaatgcta 
gttgctgatt 
gtttctgcca 



60 
120 
180 
240 
300 
360 
420 
480 
540 
600 
660 
720 
780 
840 
900 
960 

1020 

1080 

1140 

1200 



1260 



S226CAS108.ST25 

ctaagttgaa tgatctttgc ttctccaatg tctatgcaga ttcttttgta gtcaagggag 

atgatgtaag acaaatagcg ccaggacaaa ctggtgttat tgctgattat aattataaat 1320 

tgccagatga tttcatgggt tgtgtccttg cttggaatac taggaacatt gatgctactt 1380 

caactggtaa ttataattat aaatataggt atcttagaca tggcaagctt aggccctttg 1440 

agagagacat atctaatgtg cctttctccc ctgatggcaa accttgcacc ccacctgctc 1500 

ttaattgtta ttggccatta aatgattatg gtttttacac cactactggc attggctacc 1560 

aaccttacag agttgtagta ctttcttttg aacttttaaa tgcaccggcc acggtttgtg 1620 

gaccaaaatt atccactgac cttattaaga accagtgtgt caattttaat tttaatggac 1680 

tcactggtac tggtgtgtta actccttctt caaagagatt tcaaccattt caacaatttg 1740 

gccgtgatgt ctctgatttc actgattccg ttcgagatcc taaaacatct gaaatattag 1800 

acatttcacc ttgctctttt gggggtgtaa gtgtaattac acctggaaca aatgcttcat 1860 

ctgaagttgc tgttctatat caagatgtta actgcactga tgtttctaca gcaatccatg 1920 

cagatcaact cacaccagct tggcgcatat attctactgg aaacaatgta ttccagactc 1980 

aagcaggctg tcttatagga gctgagcatg tcgacacttc ttatgagtgc gacattccta 2040 

2049 

ttggagctg 

<210> 6 

<211> 2027 

<212> DNA 

<213> CORONAVIRUS 

catgcagatc aactcacacc agcttggcgc atatattcta ctggaaacaa tgtattccag 60 

actcaagcag gctgtcttrat aggagctgag catgtcgaca cttcttatga gtgcgacatt 120 

cctattggag ctggcatttg tgctagttac catacagttt ctttattacg tagtactagc 180 

caaaaatcta ttgtggctta tactatgtct ttaggtgctg atagttcaat tgcttactct 240 

aataacacca ttgctatacc tactaacttt tcaattagca ttactacaga agtaatgcct 300 

gtttctatgg ctaaaacctc cgtagattgt aatatgtaca tctgcggaga ttctactgaa 360 

tgtgctaatt tgcttctcca atatggtagc ttttgcacac aactaaatcg tgcactctca 420 

ggtattgctg ctgaacagga tcgcaacaca cgtgaagtgt tcgctcaagt caaacaaatg 480 

tacaaaaccc caactttgaa atattttggt ggttttaatt tttcacaaat attacctgac 

cctctaaagc caactaagag gtcttttatt gaggacttgc tctttaataa ggtgacactc 

gctgatgctg gcttcatgaa gcaatatggc gaatgcctag gtgatattaa tgctagagat 

ctcatttgtg cgcagaagtt caatgggctt acagtgttgc cacctctgct cactgatgat 720 

atgattgctg cctacactgc tgctctagtt agtggtactg ceactgctgg atggacattt 780 
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540 
600 
660 
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ggtgctggcg 


ctgctcttca 


aatacctttt 


gctatgcaaa 


tggcatatag 


gttcaatggc 


840 


attggagtta 


cccaaaatgt 


tctctatgag 


aaccaaaaac 


aaatcgccaa 


ccaatttaac 


900 


aaggcgatta 


gtcaaattca 


agaatcactt 


acaacaacat 


caactgcatt 


gggcaagctg 


960 


caagacgttg 


ttaaccagaa 


tgctcaagca 


ttaaacacac 


ttgttaaaca 


acttagctct 


1020 


aattttggtg 


caatttcaag 


tgtgctaaat 


gatatccttt 


cgcgacttga taaagtcgag 


1080 


gcggaggtac 


aaattgacag 


gttaattaca 


ggcagacttc 


aaagccttca aacctatgta 


1140 


acacaacaac 


taatcagggc 


tgctgaaatc 


agggcttctg 


ctaatcttgc 


tgctactaaa 


1200 


atgtctgagt 


gtgttcttgg 


acaatcaaaa 


agagttgact 


tttgtggaaa 


gggctaccac 


1260 


cttatgtcct 


tcccacaagc 


agccccgcat 


ggtgttgtct 


tcctacatgt 


cacgtatgtg 


1320 


ccatcccagg 


agaggaactt 


caccacagcg 


ccagcaattt 


gtcatgaagg 


caaagcatac 


1380 


ttccctcgtg 


aaggtgtttt 


tgtgtttaat 


ggcacttctt 


ggtttattac 


acagaggaac 


1440 


ttcttttctc 


cacaaataat 


tactacagac 


aatacatttg 


tctcaggaaa 


ttgtgatgtc 


1500 


gttattggcg 


tcattaacaa 


cacagtttat 


gatcctctgc 


aacctgagct 


tgactcattc 


1560 


aaagaagagc 


tggacaagta 


cttcaaaaat 


catacatcac 


cagatgttga 


tcttggcgac 


1620 


atttcaggca 


ttaacgcttc 


tgtcgtcaac 


attcaaaaag 


aaattgaccg 


cctcaatgag 


1680 


gtcgctaaaa 


atttaaatga 


atcactcatt 


gaccttcaag 


aattgggaaa atatgagcaa 


1740 


tatattaaat 


ggccttggta 


tgtttggctc 


ggcttcattg 


ctggactaat 


tgccatcgtc 


1800 


atggttacaa 


-4--+- r~t t — t- -4- 4- /~i 

tcttgctttg 


ttgcatgact 


agttgttgca 


gttgcctcaa gggtgcatgc 


JLODU 


tcttgtggtt 


cttgctgcaa 


gtttgatgag 


gatgactctg 


agccagttct 


caagggtgtc 




aaattacatt 


acacataaac 


gaa cttatgg 


atttgtttat 


gagatttttt 


actcttggat 




caattactgc 


acagccagta 


aaaattgaca 


atgcttctcc 


tgcaagt 




2027 


<210> 7 














<211> 1096 












<212> DNA 














<213> CORONA VIRUS 












<400> 7 

tcttgctttg ttgcatgact 


agttgttgca 


gttgcctcaa 


gggtgcatgc tcttgtggtt 


60 


cttgctgcaa gtttgatgag 


gatgactctg 


agccagttct 


caagggtgtc 


aaattacatt 


120 


acacataaac gaacttatgg 


atttgtttat 


gagatttttt 


actcttggat 


caattactgc 


i Rn 
xou 


acagccagta aaaattgaca 


atgcttctcc 


tgcaagtact 


gttcatgcta 


cagcaacgat 


240 


accgctacaa gcctcactcc 


ctttcggatg 


gcttgttatt 


ggcgttgcat ttcttgctgt 


300 


ttttcagagc 


gctaccaaaa 


taattgcgct 


caataaaaga 


tggcagctag 


ccctttataa 


360 


gggcttccag 


ttcatttgca 


atttactgct 


gctatttgtt 
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accatctatt 


cacatctttt 


420 



gcttgtcgct 
acaatgcatc 
caagaaccca 
ctactgtata 
ttcaacacca 
aggtgttaaa 
gtctacacaa 
gcttgttaaa 
taatccagca 
agcacaagaa 
aatagttaat 
catccttact 



gcaggtatgg 
aacgcatgta 
ttactttatg 
ccatataaca 
aaactcaaag 
gactatgtcg 
attactacag 
gacccaccga 
atggatccaa 
agtgagtacg 
agcgtacttc 
gcgcrt 



aggcgcaatt 
gaattattat 
atgccaacta 
gtgtcacaga 
aagactacca 
ttgtacatgg 
acactggtat 
atgtgcaaat 
tttatgatga 
aacttatgta 
tttttcttgc 



S226CAS108. 
tttgtacctc 
gagatgttgg 
ctttgtttgc 
tacaattgtc 
aattggtggt 
ctatttcacc 
tgaaaatgct 
acacacaatc 
gccgacgacg 
ctcattcgtt 
tttcgtggta 



ST25 

tatgccttga 
ctttgttgga 
tggcacacac 
gttactgaag 
tattctgagg 
gaagtttact 
acattcttca 
gacggctctt 
actactagcg 
tcggaagaaa 
ttcttgctag 



tatattttct 

agtgcaaatc 

ataactatga 

gtgacggcat 

ataggcactc 

accagcttga 

tctttaacaa 

caggagttgc 

tgcctttgta 

caggtacgtt 

tcacactagc 



<210> 8 

<211> U35 

<212> DNA 

<213> CORONAVIRUS 



480 
540 
600 
660 
720 
780 
840 
900 
960 
1020 
1080 
1096 



<400> 8 
attgccatcg 

aagggtgcat 

ctcaagggtg 

ttactcttgg 

ctgttcatgc 

ttggcgttgc 

gatggcagct 

ttaccatcta 

tctatgcctt 

ggctttgttg 

gctggcacac 

tcgttactga 

gttattctga 

ccgaagttta 

ctacattctt 

tcgacggctc 



tcatggttac 
gctcttgtgg 
tcaaattaca 
atcaattact 
tacagcaacg 
atttcttgct 
agccctttat 
ttcacatctt 
gatatatttt 
gaagtgcaaa 
acataactat 
aggtgacggc 
ggataggcac 
ctaccagctt 
catctttaac 
ttcaggagtt 



aatcttgctt 

ttcttgctgc 

ttacacataa 

gcacagccag 

ataccgctac 

gtttttcaga 

aagggcttcc 

ttgcttgtcg 

ctacaatgca 

tccaagaacc 

gactactgta 

atttcaacac 

tcaggtgtta 

gagtctacac 

aagcttgtta 

gctaatccag 



tgttgcatga 
aagtttgatg 
acgaacttat 
taaaaattga 
aagcctcact 
gcgctaccaa 
agttcatttg 
ctgcaggtat 
tcaacgcatg 
cattacttta 
taccatataa 
caaaactcaa 
aagactatgt 
aaattactac 
aagacccacc 



caatggatcc 
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ctagttgttg 
aggatgactc 
ggatttgttt 
caatgcttct 
ccctttcgga 
aataattgcg 
caatttactg 
ggaggcgcaa 
tagaattatt 
tgatgccaac 
cagtgtcaca 
agaagactac 
cgttgtacat 
agacactggt 
gaatgtgcaa 
aatttatgat 



cagttgcctc 

tgagccagtt 

atgagatttt 

cctgcaagta 

tggcttgtta 

ctcaataaaa 

ctgctatttg 

tttttgtacc 

atgagatgtt 

tactttgttt 

gatacaattg 

caaattggtg 

ggctatttca 

attgaaaatg 

atacacacaa 

gagccgacga 



60 
120 
180 
240 
300 
360 
420 
480 
540 
600 
660 
720 
780 
840 
900 
960 
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cgactactag cgtgcctttg taagcacaag aaagtgagta cgaacttatg tactcattcg 1020 

tttcggaaga aacaggtacg ttaatagtta atagcgtact tctttttctt gctttcgtgg 1080 

tattcttgct agtcacacta gccatcctta ctgcgcttcg attgtgtgcg tactg 1135 

<210> 9 

<211> 1096 

<212> DNA 

<213> CORONAVIRUS 

<220> 

<221> CDS 

<222> (137) . . (958) 

<223> 



<400> 9 

tcttgctttg ttgcatgact agttgttgca gttgcctcaa gggtgcatgc tcttgtggtt 60 

cttgctgcaa gtttgatgag gatgactctg agccagttct caagggtgtc aaattacatt 120 

acacataaac gaactt atg gat ttg ttt atg aga ttt ttt act ctt gga tea 172 
Met Asp Leu Phe Met Arg Phe Phe Thr Leu Gly ser 
1 5 10 

att act gca cag cca gta aaa att gac aat get tct cct gca agt act 220 
lie Thr Ala Gin Pro val Lys lie Asp Asn Ala Ser Pro Ala ser Thr 
15 20 25 

gtt cat get aca gca acg ata ccg eta caa gee tea etc cct ttc gga 268 
Val His Ala Thr Ala Thr lie Pro Leu Gin Ala ser Leu Pro Phe Gly 
30 35 40 

tgg ctt gtt att gqc gtt gca ttt ctt get gtt ttt cag age get acc 316 
Trp Leu Val lie Gly val Ala Phe Leu Ala Val Phe Gin ser Ala Thr 
45 50 55 60 

aaa ata att gcg etc aat aaa aga tgg cag eta gee ctt tat aag gqc 364 
Lys lie lie Ala Leu Asn Lys Arg Trp Gin Leu Ala Leu Tyr Lys Gly 
65 70 75 

ttc cag ttc att tgc aat tta ctg ctg eta ttt gtt ace ate tat tea 412 
Phe Gin Phe lie cys Asn Leu Leu Leu Leu Phe val Thr lie Tyr Ser 
80 85 90 

cat ctt ttg ctt gtc get gca gqt atg gag gcg caa ttt ttg tac etc 460 
His Leu Leu Leu Val Ala Ala Gly Met Glu Ala Gin Phe Leu Tyr Leu 
95 100 105 

tat gee ttg ata tat ttt eta caa tgc ate aac gca tgt aga att att 508 
Tyr Ala Leu lie Tyr Phe Leu Gin cys lie Asn Ala Cys Arg He lie 
110 115 120 

atg aga tgt tgg ctt tgt tgg aag tgc aaa tec aag aac cca tta ctt 556 

Met Arg cys Trp Leu cys Trp Lys cys Lys ser Lys Asn Pro Leu Leu 
125 ^ * 130 135 140 
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604 



tat aat acc aac tac ttt gtt tgc tgg cac aca cat aac tat gac tac 
Tyr Sp Ala Asn Tyr Phe Val Cys Trp His Thr His Asn Tyr Asp Tyr 

tat ata cca tat aac agt gtc aca gat aca att gtc gtt act gaa ggt 
cys SlS Pro Tyr Asn ser val Thr Asp Thr He Val val Thr Glu cty 
160 165 170 

gac ggc att tea aca cca aaa etc aaa gaa gac tac caa att ggt ggt 
Asp Gly lie Ser Thr Pro Lys Leu l_ys Glu Asp Tyr Gin lie Gly Gly 
175 180 185 

tat tct gag gat agg cac tea ggt gtt aaa gac tat gtc gtt gta cat 
Tyr ser Glu Asp Arg His ser Gly val Lys Asp Tyr val val val ms 
190 195 200 

ggc tat ttc acc gaa gtt tac tac cag ctt gag tct aca caa att act 

Gly Tyr Phe Thr Glu val Tyr Tyr Gin Leu Glu ser Thr Gin lie Thr 
205 210 215 

aca aac act aat att qaa aat get aca ttc ttc ate ttt aac aag ctt 

Thr A?p Thr G?y lie Glu Asn Ala Thr Phe Phe He Phe Asn Lys Leu 

225 230 235 

att aaa qac cca ccg aat gtg caa ata cac aca ate gac ggc tct tea 892 
val Lys Asp Pro Pro Asn val Gin He His Thr He Asp Gly Ser ser 
240 245 250 

gga gtt get aat cca gca atg gat cca att tat gat gag ccg acg acg 
Gly val Ala Asn Pro Ala Met Asp Pro lie Tyr Asp Glu Pro Thr Thr 
'255 260 265 

act act age gtg cct ttg taagcacaag aaagtgagta cgaacttatg 

Thr Thr ser val Pro Leu r 
270 

tactcattcg ttteggaaga aacaggtacg ttaatagtta atagegtact tctttttctt 1048 ^ 
gctttcgtgg tattcttget agtcacacta gccatcctta ctgegett 



652 



700 



748 



796 



844 



940 



988 



1096 



<210> 10 

<211> 274 

<212> PRT 

<213> CORONAVIRUS 



<400> 10 

Met Asp Leu Phe Met Arg Phe Phe Thr Leu Gly Ser lie Thr Ala Gin 
15 10 I 5 

Pro Val Lys lie Asp Asn Ala Ser Pro Ala ser Thr Val His Ala Thr 
20 25 30 

Ala Thr He Pro Leu Gin Ala Ser Leu Pro Phe Gly Trp Leu val lie 
35 40 45 

Gly val Ala Phe Leu Ala val Phe Gin ser Ala Thr Lys lie He Ala 

50 55 60 
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Leu Asn Lys Arg Trp Gin Leu Ala Leu Tyr Lys Gly Phe Gin Phe lie 
65 70 75 80 

Cys Asn Leu Leu Leu Leu Phe Val Thr lie Tyr ser His Leu Leu Leu 
85 90 95 

Val Ala Ala Gly Met Glu Ala Gin Phe Leu Tyr Leu Tyr Ala Leu lie 
100 105 110 

Tyr Phe Leu Gin cys lie Asn Ala Cys Arg He lie Met Arg cys Trp 
115 120 ~ 125 

Leu cys Trp Lys cys Lys ser Lys Asn Pro Leu Leu Tyr Asp Ala Asn 
130 135 140 

Tyr Phe Val cys Trp His Thr His Asn Tyr Asp Tyr cys lie Pro Tyr 
145 150 155 160 

Asn Ser Val Thr Asp Thr lie Val val Thr Glu Gly Asp Gly lie Ser 
165 170 175 

Thr Pro Lys Leu Lys Glu Asp Tyr Gin He Gly Gly Tyr Ser Glu Asp 
180 185 190 

Arg His ser Gly val Lys Asp Tyr val val val His Gly Tyr phe Thr 
195 200 205 

Glu val Tyr Tyr Gin Leu Glu ser Thr Gin He Thr Thr Asp Thr Gly 
210 215 220 

lie Glu Asn Ala Thr Phe Phe lie Phe Asn Lys Leu Val Lys Asp Pro 
225 230 235 240 

Pro Asn val Gin lie His Thr lie Asp Gly Ser ser Gly val Ala Asn 
245 250 255 

Pro Ala Met Asp Pro lie Tyr Asp Glu Pro Thr Thr Thr Thr ser Val 
260 265 270 

Pro Leu 



<210> 11 

<211> 1096 

<212> DNA 

<213> CORONAVIRUS 
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<220> 

<221> CDS 

<222> (558). .0-019) 

<223> 



<400> 11 
tcttgctttg 


ttgcatgact agttgttgca 


gttgcctcaa 


gggtgcatgc 


tcttgtggtt 


60 


cttgctgcaa 


gtttgatgag gatgactctg 


agecagttet 


caagggtgtc 


aaattacatt 


120 


acacataaac 


gaacttatgg atttgtttat 


gagatttttt 


actcttggat 


caattactgc 


180 


acagccagta 


aaaattgaca atgcttctcc 


tgcaagtact 


gttcatgeta 


cagcaacgat 


240 


accgctacaa 


gcctcactcc ctttcggatg 


gcttgttatt 


ggcgttgcat 


ttcttgctgt 


300 


ttttcagagc 


gctaccaaaa taattgcgct 


caataaaaga 


tggcagctag 


ccctttataa 


360 


gggcttccag 


ttcatttgca atttactgct 


gctatttgtt 


accatctatt 


cacatctttt 


420 


gcttgtcgct 


gcaggtatgg aggcgcaatt 


tttgtacctc 


tatgecttga 


tatattttct 


480 


acaatgcatc 


aacgcatgta gaattattat 


gagatgttgg 


ctttgttgga 


agtgcaaatc 


540 


caagaaccca 


ttacttt atg atg cca act act ttg ttt get ggc 
Met Met Pro Thr Thr Leu Phe Ala Gly 
1 5 


aca cac 
Thr His 
10 


590 



ata act atg act act gta tac cat ata aca gtg tea cag ata caa ttg 638 

He Thr Met Thr Thr Val Tyr His lie Thr Val Ser Gin lie Gin Leu 

15 20 25 

teg tta ctg aag gtg acg gca ttt caa cac caa aac tea aag aag act 686 » 

Ser Leu Leu Lys val Thr Ala Phe Gin His Gin Asn Ser Lys Lys Thr ^ 

30 35 40 

acc aaa ttg gtg gtt att ctg agg ata gqc act cag gtg tta aag act 734 

Thr Lys Leu val val lie Leu Arg lie Gly Thr Gin val Leu Lys Thr 
45 50 55 

atg teg ttg tac atg get att tea ccg aag ttt act acc age ttg agt 782 

Met Ser Leu Tyr Met Ala lie Ser Pro Lys Phe Thr Thr Ser Leu ser 
60 65 70 75 

eta cac aaa tta eta cag aca ctg gta ttg aaa atg eta cat tct tea 830 

Leu His Lys Leu Leu Gin Thr Leu val Leu Lys Met Leu His ser ser 
80 85 90 

tct tta aca age ttg tta aag acc cac cga atg tgc aaa tac aca caa 878 

ser Leu Thr Ser Leu Leu Lys Thr His Arg Met cys Lys Tyr Thr Gin 

95 100 105 

teg acg get ctt cag gag ttg eta ate cag caa tgg ate caa ttt atg 926 

Ser Thr Ala Leu Gin Glu Leu Leu lie Gin Gin Trp lie Gin Phe Met 

110 115 120 

atg age cga cga cga eta eta gcg tgc ctt tgt aag cac aag aaa gtg 974 

Met Ser Arq Arg Arg Leu Leu Ala cys Leu cys Lys His Lys Lys val 
125 130 135 

agt acg aac tta tgt act cat teg ttt egg aag aaa cag gta cgt 1019 

ser Thr Asn Leu cys Thr His ser Phe Arg Lys Lys Gin Val Arg 
140 145 150 
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taatagttaa tagcgtactt ctttttcttg ctttcgtggt attcttgcta gtcacactag 1079 
ccatccttac tgcgctt 1096 

<210> 12 

<211> 154 

<212> PRT 

<213> CORONAVIRUS 

<400> 12 

Met Met Pro Thr Thr Leu Phe Ala Gly Thr His lie Thr Met Thr Thr 
1 5 10 15 

val Tyr His lie Thr val ser Gin He Gin Leu ser Leu Leu Lys val 
20 25 30 

Thr Ala Phe Gin His Gin Asn Ser Lys Lys Thr Thr Lys Leu val val 
35 40 45 

lie Leu Arg He Gly Thr Gin Val Leu Lys Thr Met ser Leu Tyr Met 
50 55 60 

Ala lie Ser pro Lys Phe Thr Thr Ser Leu ser Leu His Lys Leu Leu 
o:> 70 75 80 

Gin Thr Leu Val Leu Lys Met Leu His ser ser Ser Leu Thr ser Leu 
85 90 95 

Leu Lys Thr His Arg Met Cys Lys Tyr Thr Gin ser Thr Ala Leu Gin 
100 105 110 

Glu Leu Leu He Gin Gin Trp He Gin Phe Met Met ser Arg Arq Ara 
115 120 125 

Leu Leu Ala Cys Leu Cys Lys His Lys Lys Val Ser Thr Asn Leu Cys 
■"0 135 140 

Thr His ser Phe Arg Lys Lys Gin Val Arg 
145 150 

<210> 13 

<211> 332 

<212> DNA 

<213> CORONAVIRUS 
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<220> 

<221> CDS 

<222> (36).. (263) 

<223> 



<400> 13 

tgcctttgta agcacaagaa agtgagtacg aactt atg tac tea ttc gtt teg 53 

Met Tyr Ser Phe val Ser 
1 5 

gaa gaa aca ggt acg tta ata gtt aat age gta ctt ctt ttt ctt get 101 
Glu Glu Thr Giy Thr Leu lie val Asn Ser Val Leu Leu Phe Leu Ala 
10 15 20 

ttc gtg gta ttc ttg eta gtc aca eta gee ate ctt act gcg ctt cga 149 
Phe val Val Phe Leu Leu Val Thr Leu Ala lie Leu Thr Ala Leu Arg 
25 30 35 

ttg tgt gcg tac tgc tgc aat att gtt aac gtg agt tta gta aaa cca 197 
Leu Cys Ala Tyr Cys Cys Asn lie val Asn Val Ser Leu Val Lys Pro 
40 45 50 

acg gtt tac gtc tac teg cgt gtt aaa aat ctg aac tct tct gaa gqa 245 
Thr val Tyr Val Tyr Ser Arg val Lys Asn Leu Asn Ser Ser Glu Gly 
55 60 65 70 

gtt cct gat ctt ctg gtc taaacgaact aactattatt attattctgt 293 
Val Pro Asp Leu Leu Val 
75 

ttggaacttt aacattgett atcatggcag acaaeggta 332 



<210> 


14 


'v. 


<211> 


76 




<212> 


PRT 




<213> 


CORONAVIRUS 




<400> 


14 





Met Tyr Ser Phe val Ser Glu Glu Thr Gly Thr Leu lie val Asn ser 
15 10 15 

Val Leu Leu Phe Leu Ala Phe val val Phe Leu Leu val Thr Leu Ala 
20 25 30 

lie Leu Thr Ala Leu Arg Leu Cys Ala Tyr cys Cys Asn lie Val Asn 
35 40 45 

Val ser Leu Val Lys Pro Thr Val Tyr Val Tyr Ser Arg val Lys Asn 
50 55 60 

Leu Asn Ser ser Glu Gly val Pro Asp Leu Leu Val 
65 70 75 
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<210> 


15 


<211> 


332 


<212> 


DNA 


<213> 


CORONAVIRUS 


<400> 


15 



tgcctttgta agcacaagaa agtgagtacg aacttatgta ctcattcgtt tcggaagaaa 60 

caggtacgtt aatagttaat agcgtacttc tttttcttgc tttcgtggta ttcttgctag 120 

tcacactagc catccttact gcgcttcgat tgtgtgcgta ctgctgcaat attgttaacg 180 

tgagtttagt aaaaccaacg gtttacgtct actcgcgtgt taaaaatctg aactcttctg 240 

aaggagttcc tgatcttctg gtctaaacga actaactatt attattattc tgtttggaac 300 

tttaacattg cttatcatgg cagacaacgg ta 332 

<210> 16 

<211> 708 

<212> DNA 

<213> CORONAVIRUS 

<220> 

<221> CDS 

<222> (41) . . (703) 

<223> 



tattattatt attctgtttg gaactttaac attgcttatc atg gca gac aac ggt 55 

Met Ala Asp Asn Gly 

act att acc gtt gag gag ctt aaa caa etc ctg gaa caa tgg aac eta 103 
Thr lie Thr Val Glu Glu Leu Lys Gin Leu Leu Glu Gin Trp Asn Leu 
10 15 20 



gta ata ggt ttc eta ttc eta gec tgg att atg tta eta caa ttt gec 
Val lie Gly Phe Leu Phe Leu Ala Trp lie Met Leu Leu Gin Phe Ala 
25 30 35 



151 



tat tct aat egg aac agg ttt ttg tac ata ata aag ctt gtt ttc etc 199 

Tyr ser Asn Arg Asn Arg Phe Leu Tyr lie lie Lys Leu val Phe Leu 
40 ~ 45 50 

tgg etc ttg tgg cca gta aca ctt get tgt ttt gtg ctt get get gtc 247 

Trp Leu Leu Trp Pro val Thr Leu Ala Cys Phe val Leu Ala Ala Val 

55 60 65 

tac aga att aat tgg gtg act ggc ggg att gcg att gca atg get tgt 295 
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Tyr Arg He Asn Trp val Thr Gly Gly He Ala He Ala Met Ala cgs 
70 " 75 

Si «B »5 S3 S3 ?? 9 p Si US Sf SS fa? SB IS SS S$ S8 



90 



Phi Jffi 35 i Arg S? 53 ?S i SS S5 SS 85 «J SS SR 

S SS "n fa? SS 2S Arg ffi «? SB «H ?S Sj SS SS S3 

120 125 X3 

aH f oaa ctt ate att ggt get gtg ate att cgt ggt cac ttg cga 
1?S Ifr Glu val lie Hv Xla va? He He Arg G?y His Leu Arg 
135 140 J-**- 5 

afn nrr nna rac tec eta qgg cgc tgt gac att aag gac ctg cca aaa 
Se? Ala §?? Sis sir lbu H? Arg c?s Asp lie Lys Asp Leu Pro Lys 
150 155 J- b0 

nan ate act ata act aca tea cga acg ctt tct tat tac aaa tta gga 
US lie Thr va? 85 Thr ser Arg Thr Leu ser Tyr Tyr Lys Leu G?y 
170 17 -> 

S51 2? SS S «B 95 ?"r 5S SS W SS IB SB §f SS a?S 



i-ar rot att aaa aac tat aaa tta aat aca gac cac gec ggt age aac 
T?r Arg lie SS T?r Lys Leu Asn Thr Asp His A a G?y ser Asn 
200 205 zxu 

gac aat att get ttg eta gta cag taagt 
Asp Asn lie Ala Leu Leu val Gin 
215 22 ° 

<210> 17 

<211> 221 

<212> PRT 

<213> CORONAVIRUS 

<400> 17 

Met Ala Asp Asn Gly Thr lie Thr Val Glu Glu Leu Lys Gin Leu Leu 
1 5 10 AJ 

Glu Gin Trp Asn Leu Val lie Gly Phe Leu Phe Leu Ala Trp lie Met 
20 2 5 iV 

Leu Leu Gin Phe Ala Tyr Ser Asn Arg Asn Arg Phe Leu Tyr lie lie 
35 40 4:> 

Lys Leu val Phe Leu Trp Leu Leu Trp Pro Val Thr Leu Ala Cys Phe 
50 55 
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439 

487 

535 

583 

631 

679 
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val Leu Ala Ala Val Tyr Arg He Asn Trp val Thr Gly Gly lie Ala 
65 70 75 80 

He Ala Met Ala cys lie Val Gly Leu Met Trp Leu Ser Tyr Phe val 
85 90 95 

Ala ser Phe Arg Leu Phe Ala Arg Thr Arg ser Met Trp ser Phe Asn 
100 105 110 

Pro Glu Thr Asn lie Leu Leu Asn Val Pro Leu Arg Gly Thr lie Val 
115 120 125 

Thr Arg Pro Leu Met Glu ser Glu Leu Val lie Gly Ala Val He lie 
130 135 140 

Arg Gly His Leu Arg Met Ala Gly His Ser Leu Gly Arg Cys Asp He 
145 150 155 160 

Lys Asp Leu Pro Lys Glu lie Thr val Ala Thr ser Arg Thr Leu ser 
165 170 175 

Tyr Tyr Lys Leu Gly Ala ser Gin Arg Val Gly Thr Asp ser Gly Phe 
180 185 190 

Ala Ala Tyr Asn Arg Tyr Arg lie Gly Asn Tyr Lys Leu Asn Thr Asp 
195 200 205 

His Ala Gly ser Asn Asp Asn lie Ala Leu Leu val Gin 
210 215 220 

<210> 18 
<211> 769 
<212> DNA 

-<213>-~ -GORQNAV-I-RUS - — - 



<400> 18 

cctgatcttc tggtctaaac gaactaacta ttattattat tctgtttgga actttaacat 60 

tgcttatcat ggcagacaac ggtactatta ccgttgagga gcttaaacaa ctcctggaac 120 

aatggaacct agtaataggt ttcctattcc tagcctggat tatgttacta caatttgcct 180 

attctaatcg gaacaggttt ttgtacataa taaagcttgt tttcctctgg ctcttgtggc 240 

cagtaacact tgcttgtttt gtgcttgctg ctgtctacag aattaattgg gtgactggcg 300 

ggattgcgat tgcaatggct tgtattgtag gcttgatgtg gcttagctac ttcgttgctt 360 

ccttcaggct gtttgctcgt acccgctcaa tgtggtcatt caacccagaa acaaacattc 420 

ttctcaatgt gcctctccgg gggacaattg tgaccagacc gctcatggaa agtgaacttg 480 

tcattggtgc tgtgatcatt cgtggtcact tgcgaatggc cggacactcc ctagggcgct 540 
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gtgacattaa ggacctgcca aaagagatca ctgtggctac atcacgaacg ctttcttatt 600 

acaaattagg agcgtcgcag cgtgtaggca ctgattcagg ttttgctgca tacaaccgct 660 

accgtattgg aaactataaa ttaaatacag accacgccgg tagcaacgac aatattgctt 720 

tgctagtaca gtaagtgaca acagatgttt catcttgttg acttccagg 769 

<210> 19 
<211> 1231 
<212> DNA 
<213> CORONAVIRUS 

taccgtattg gaaactataa attaaataca gaccacgccg gtagcaacga caatattgct 60 
ttgctagtac agtaagtgac aacagatgtt tcatcttgtt gacttccagg ttacaatagc 120 
agagatattg attatcatta tgaggacttt caggattgct atttggaatc ttgacgttat 180 
aataagttca atagtgagac aattatttaa gcctctaact aagaagaatt attcggagtt 240 
agatgatgaa gaacctatgg agttagatta tccataaaac gaacatgaaa attattctct 300 
tcctgacatt gattgtattt acatcttgcg agctatatca ctatcaggag tgtgttagag 360 
gtacgactgt actactaaaa gaaccttgcc catcaggaac atacgagggc aattcaccat 420 
ttcaccctct tgctgacaat aaatttgcac taacttgcac tagcacacac tttgcttttg 480 
cttgtgctga cggtactcga catacctatc agctgcgtgc aagatcagtt tcaccaaaac 540 
ttttcatcag acaagaggag gttcaacaag agctctactc gccacttttt ctcattgttg 
ctgctctagt atttttaata ctttgcttca ccattaagag aaagacagaa tgaatgagct 
cactttaatt gacttctatt tgtgcttttt agcctttctg ctattccttg ttttaataat 
gcttattata ttttggtttt cactcgaaat ccaggatcta gaagaacctt gtaccaaagt 780 
ctaaacgaac atgaaacttc tcattgtttt gacttgtatt tctctatgca gttgcatatg 
cactgtagta cagcgctgtg catctaataa acctcatgtg cttgaagatc cttgtaaggt 
acaacactag gggtaatact tatagcactg cttggctttg tgctctagga aaggttttac 
cttttcatag atggcacact atggttcaaa catgcacacc taatgttact atcaactgtc 
aagatccagc tggtggtgcg cttatagcta ggtgttggta ccttcatgaa ggtcaccaaa 1080 
ctgctgcatt tagagacgta cttgttgttt taaataaacg aacaaattaa aatgtctgat 1140 
aatggacccc aatcaaacca acgtagtgcc ccccgcatta catttggtgg acccacagat 1200 
tcaactgaca ataaccagaa tggaggacgc a 



600 
660 
720 



840 
900 
960 
1020 



1231 



<210> 20 
<211> 1242 
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<212> DNA 

<213> CORONAVIRUS 



<400> 20 
gcatacaacc 


gctaccgtat 


tggaaactat aaattaaata 


cagaccacgc 


^-/~»/~t-j~ r* t~\ f a a (~ 

cgyxd.gc.dci^ 


fin 


gacaatattg 


ctttgctagt 


acagtaagtg acaacagatg 


tttcatcttg 


xxgacxxcca 


n on 

X£.\J 


ggttacaata 


gcagagatat 


tgattatcat tatgaggact 


ttcaggattg 


cxax x tggaa 




tcttgacgtt 


ataataagtt 


caatagtgag acagttattt 


aagcctctaa 


cxaagaagaa 




ttattcggag 


ttagatgatg 


aagaacctat ggagttagat 


tatccataaa 


acgaacatga 




aaattattct 


cttcctgaca 


ttgattgtat ttacatcttg 


cgagctatat 


cactatcagg 


3£A 


agtgtgttag 


aggtacgact 


gtactactaa aagaaccttg 


cccatcagga 


acatacgagg 




gcaattcacc 


atttcaccct 


cttgctgaca ataaatttgc 


actaacttgc 


actagcacac 




actttgcttt 


tgcttgtgct 


gacggtactc gacataccta tcagctgcgt 


gcaagatcag 




tttcaccaaa 


acttttcatc 


agacaagagg aggttcaaca agagctctac 


tcgccacttt 


CAA 


ttctcattgt 


tgctgctcta 


gtatttrttaa tactttgctt 


caccattaag 


agaaagacag 


560 


aatgaatgag 


ctcactttaa 


ttgacttcta tttgtgcttt 


ttagcctttc 


tgctattcct 


720 


tgttttaata 


atgcttatta 


tattttggtt ttcactcgaa 


atccaggatc 


tagaagaacc 


780 


ttgtaccaaa 


gtctaaacga 


acatgaaact tctcattgtt 


ttgacttgta tttctctatg 


840 


cagttgcata 


tgcactgtag 


tacagcgctg tgcatctaat aaacctcatg 


tgcttgaaga 


900 


tccttgtaag 


gtacaacact 


aggggtaata cttatagcac tgcttggctt 


tgtgctctag 


960 


gaaaggtttt 


accttttcat 


agatggcaca ctatggttca 


aacatgcaca 


cctaatgtta 


1020 


ctatcaactg 


tcaagatcca 


gctggtggtg cgcttatagc 


taggtgttgg 


taccttcatg 


1080 


aaggtcacca 


aactgctgca 


tttagagacg tacttgttgt 


tttaaataaa 


cgaacgaatt 


1140 


aaaatgtctg 


ataatggacc 


ccaatcaaac caacgtagtg 


ccccccgcat 


tacatttggt 


1200 


ggacccacag 


attcaactga 


caataaccag aatggaggac 






1242 



<210> 21 

<211> 1231 

<212> DNA 

<213> CORONAVIRUS 

<220> 

<221> CDS 

<222> (86) . . (274) 

<223> 
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tacc"gtattg gaaactataa attaaataca gaccacgccg gtagcaacga caatattgct 
ttgctagtac agtaagtgac aacag atg ttt cat ctt gtt gac «c cag gtt 

1 5 

aca ata qca gag ata ttg att ate att atg agg act ttc agg att get 
Thr ill Ala Glu He Leu He lie He Met Arg Thr Phe Arg lie Ala 
10 15 20 " 

att taa aat ctt qac gtt ata ata agt tea ata gtg aga caa tta ttt 
lie T 9 rp 3S LeS Asp val He He sir |er He vaT Arg Gin Leu Phe 

aaa cct eta act aag aag aat tat teg gag tta gat gat gaa gaa cct 
L?l Prl tlu Thr Lyi Lys Asn Tyr Ser Glu Leu Asp Asp Glu Glu Pro 
45 50 5b 

atg gag tta gat tat cca taaaacgaac atgaaaatta ttctcttcct 
Met Glu Leu Asp Tyr Pro 
60 

gacattgatt gtatttacat ettgegaget atatcactat caggagtgtg ttagaggtac 
gactgtacta ctaaaagaac cttgcccatc aggaacatac gagggcaatt caccatttca 
ccctcttgct gacaataaat ttgeactaac ttgeactage acacactttg ettttgettg 
tgctgacggt actcgacata cctatcagct gcgtgcaaga tcagtttcac caaaactttt 
catcagacaa gaggaggttc aacaagagct ctactcgcca ctttttctca ttgttgctgc 
tctagtattt ttaatacttt gcttcaccat taagagaaag acagaatgaa tgagctcact 
ttaattgact tctatttgtg etttttagee tttctgetat tccttgtttt aataatgett 
attatatttt ggttttcact cgaaatccag gatctagaag aaccttgtac caaagtctaa 
acgaacatga aacttctcat tgttttgact tgtatttctc tatgcagttg catatgeact 
gtagtacagc gctgtgcatc taataaacct catgtgcttg aagatccttg taaggtacaa 
cactaggggt aatacttata geactgettg gctttgtgct ctaggaaagg ttttaccttt 
tcatagatgg cacactatgg ttcaaacatg cacacctaat gttactatca actgtcaaga 
tccagctggt ggtgcgctta tagctaggtg ttggtacctt catgaaggtc accaaactgc 
tgcatttaga gaegtacttg ttgttttaaa taaacgaaca aattaaaatg tctgataatg 
gaccccaatc aaaccaacgt agtgcccccc gcattacatt tggtggaccc acagattcaa 
ctgacaataa ccagaatgga ggacgea 



60 
112 

160 

208 

256 

304 

364 
424 
484 
544 
604 
664 
724 
784 
844 
904 
964 
1024 
1084 
1144 
•1204 
1231 



<210> 22 

<211> 63 

<212> PRT 

<213> CORONAVIRUS 
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<400> 22 

Met Phe His Leu val Asp Phe Gin Val Thr lie Ala Glu lie Leu lie 
1 5 10 15 

lie lie Met Arg Thr Phe Arg lie Ala lie Trp Asn Leu Asp val lie 
20 25 30 

lie ser Ser lie Val Arg Gin Leu Phe Lys Pro Leu Thr Lys Lys Asn 
35 40 45 

Tyr Ser Glu Leu Asp Asp Glu Glu Pro Met Glu Leu Asp Tyr Pro 
50 55 60 

<210> 23 

<211> 1231 

<212> DNA 

<213> CORONAVIRUS 



<220> 

<221> CDS 

<222> (285}.. (650) 

<223> 



<400> 23 

taccgtattg gaaactataa attaaataca gaccacgccg gtagcaacga caatattgct 
ttgctagtac agtaagtgac aacagatgtt tcatcttgtt gacttccagg ttacaatagc 
agagatattg attatcatta tgaggacttt caggattgct atttggaatc ttgacgttat 
aataagttca atagtgagac aattatttaa gcctctaact aagaagaatt attcggagtt 



agatgatgaa gaacctatgg agttagatta tccataaaac gaac atg aaa att att 

Met Lys lie He 



etc ttc ctg aca ttg att gta ttt aca tct tgc gag eta tat cac tat 
Leu Phe Leu Thr Leu lie val Phe Thr ser cys Glu Leu Tyr His Tyr 
5 10 15 20 

cag gag tgt gtt aga ggt acg act gta eta eta aaa gaa cct tgc cca 
Gin Glu Cys Val Arg Gly Thr Thr Val Leu Leu Lys Glu Pro cys Pro 
25 30 35 

tea gqa aca tac gag gqc aat tea cca ttt cac cct ctt get gac aat 
ser Gly Thr Tyr Glu Gly Asn Ser Pro Phe His Pro Leu Ala Asp Asn 
40 45 50 

aaa ttt gca eta act tgc act age aca cac ttt get ttt get tgt get 
Lys Phe Ala Leu Thr cys Thr Ser Thr His Phe Ala Phe Ala Cys Ala 
55 60 65 

gac ggt act cga cat ace tat cag ctg cgt gca aga tea gtt tea cca 
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Asd Gly Thr Arg His Thr Tyr Gin Leu Arg Ala Arg ser val Ser Pro 
70 75 80 

aaa ctt ttc ate aga caa gag gag gtt caa caa gag etc tac teg cca 584 
Lys Leu Phe lie Arg Gin Glu Glu val Gin Gin Glu Leu Tyr ser Pro 
85 90 95 100 

ctt ttt etc att gtt get get eta gta ttt tta ata ctt tgc ttc acc 632 
Leu Phe Leu lie val Ala Ala Leu Val Phe Leu lie Leu cys Phe Thr 
105 110 115 

att aag aga aag aca gaa tgaatgagct cactttaatt gacttctatt 680 
lie Lys Arg Lys Thr Glu 
120 

tgtgcttttt agectttctg ctattccttg ttttaataat gcttattata ttttggtttt 740 

cactcgaaat ccaggatcta gaagaacctt gtaccaaagt ctaaacgaac atgaaacttc 800 

tcattgtttt gacttgtatt tetctatgea gttgcatatg cactgtagta cagcgctgtg 860 

catctaataa acctcatgtg cttgaagatc cttgtaaggt acaacactag gggtaatact 920 

tatagcactg cttggctttg tgctctagga aaggttttac cttttcatag atggcacact 980 

atggttcaaa catgcacacc taatgttact atcaactgtc aagatccagc tggtggtgcg 1040 

cttatagcta ggtgttggta ccttcatgaa ggtcaccaaa ctgetgeatt tagagaegta 1100 

cttgttgttt taaataaacg aacaaattaa aatgtctgat aatggacccc aatcaaacca 1160 

aegtagtgee ccccgcatta catttggtgg acccacagat tcaactgaca ataaccagaa 1220 

tggaggaege a 1231 

<210> 24 

<211> 122 

<212> PRT 

<213> CORONAVIRUS 

<400> 24 

Met Lys lie lie Leu Phe Leu Thr Leu lie val Phe Thr Ser Cys Glu 
15 10 15 

Leu Tyr His Tyr Gin Glu Cys Val Arg Gly Thr Thr val Leu Leu Lys 
20 25 30 

Glu Pro Cys Pro ser Gly Thr Tyr Glu Gly Asn Ser Pro Phe His Pro 
35 40 45 

Leu Ala Asp Asn Lys Phe Ala Leu Thr Cys Thr ser Thr His Phe Ala 
50 55 60 

Phe Ala cys Ala Asp Gly Thr Arg His Thr Tyr Gin Leu Arg Ala Arg 
65 70 ~ 75 80 
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Ser val Ser Pro Lys Leu Phe He Arg Gin Glu Glu Val Gin Gin Glu 
85 90 95 

Leu Tyr Ser Pro Leu Phe Leu lie Val Ala Ala Leu Val Phe Leu lie 
100 105 110 

Leu cys Phe Thr lie Lys Arg Lys Thr Glu 
115 120 

<210> 25 

<211> 1231 

<212> DNA 

<213> CORONAVTRUS 



<220> 

<221> CDS 

<222> (650) . . C781) 

<223> 

<400> 25 

taccgtattg gaaactataa attaaataca gaccacgccg gtagcaacga caatattgct 60 

ttgctagtac agtaagtgac aacagatgtt tcatcttgtt gacttccagg ttacaatagc 120 

agagatattg attatcatta tgaggacttt caggattgct atttggaatc ttgacgttat 180 

aataagttca atagtgagac aattatttaa gcctctaact aagaagaatt attcggagtt 240 

agatgatgaa gaacctatgg agttagatta tccataaaac gaacatgaaa attattctct 300 

tcctgacatt gattgtattt acatcttgcg agctatatca ctatcaggag tgtgttagag 360 

gtacgactgt actactaaaa gaaccttgcc catcaggaac atacgagggc aattcaccat 420 

tTcaccctrt^ ~~" 

cttgtgctga cggtactcga catacctatc agctgcgtgc aagatcagtt tcaccaaaac 540 

ttttcatcag acaagaggag gttcaacaag agctctactc gccacttttt ctcattgttg 600 

ctgctctagt atttttaata ctttgcttca ccattaagag aaagacaga atg aat gag 658 

Met Asn Glu 
1 

etc act tta att gac ttc tat ttg tgc ttt tta qcc ttt eta eta 1-1-r 7na 
Leu Thr Leu lie Asp Phe Tyr Leu cys Phe Leu Ala Phe Hu 55 Phe 
•> 10 15 

ctt gtt tta ata atg ctt att ata ttt tqq ttt tea etc aaa atr ran 7U 
Leu val Leu lie Met Leu He He Phe Trp Phe ler Le5 Glu xlS Gin* 754 
* u 25 30 35 

gat eta gaa gaa cct tgt ace aaa gtc taaacgaaca tqaaacttct am 
Asp Leu Glu Glu Pro Cys Thr Lys val Lgddactecx 801 

40 
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cattgttttg 
atctaataaa 
atagcactgc 
tggttcaaac 
ttatagctag 
ttgttgtttt 
cgtagtgccc 
ggaggacgca 



S226CAS108.ST25 
acttgtattt ctctatgcag ttgcatatgc actgtagtac agcgctgtgc 
cctcatgtgc ttgaagatcc ttgtaaggta caacactagg ggtaatactt 
ttggctttgt gctctaggaa aggttttacc ttttcataga tggcacacta 
atgcacacct aatgttacta tcaactgtca agatccagct ggtggtgcgc 
gtgttggtac cttcatgaag gtcaccaaac tgctgcattt agagacgtac 
aaataaacga acaaattaaa atgtctgata atggacccca atcaaaccaa 
cccgcattac atttggtgga cccacagatt caactgacaa taaccagaat 



861 
921 
981 
1041 
1101 
1161 
1221 
1231 



<210> 26 

<211> 44 

<212> PRT 

<213> CORONAVIRUS 



<400> 26 

Met Asn Glu Leu Thr Leu lie Asp Phe Tyr Leu cys Phe Leu Ala Phe 
15 10 15 

Leu Leu Phe Leu val Leu lie Met Leu He lie Phe Trp Phe Ser Leu 
20 25 30 



Glu He Gin Asp Leu Glu Glu Pro Cys Thr Lys val 
35 40 



<210> 27 

<211> 1231 

<212> DNA 

<213> CORONAVIRUS 



<220> 

<221> CDS 

<222> C791) . . (907) 

<223> 



<400> 27 

taccgtattg gaaactataa attaaataca 

ttgctagtac agtaagtgac aacagatgtt 

agagatattg attatcatta tgaggacttt 



gaccacgccg gtagcaacga caatattgct 60 

tcatcttgtt gacttccagg ttacaatagc 120 

caggattgct atttggaatc ttgacgttat 180 
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aataagttca atagtgagac aattatttaa gcctctaact aagaagaatt attcggagtt 240 

agatgatgaa gaacctatgg agttagatta tccataaaac gaacatgaaa attattctct 300 

tcctgacatt gattgtattt acatcttgcg agctatatca ctatcaggag tgtgttagag 360 

gtacgactgt actactaaaa gaaccttgcc catcaggaac atacgagggc aattcaccat 420 

ttcaccctct tgctgacaat aaatttgcac taacttgcac tagcacacac tttgcttttg 480 

cttgtgctga cggtactcga catacctatc agctgcgtgc aagatcagtt tcaccaaaac 540 

ttttcatcag acaagaggag gttcaacaag agctctactc gccacttttt ctcattgttg 600 

ctgctctagt atttttaata ctttgcttca ccattaagag aaagacagaa tgaatgagct 660 

cactttaatt gacttctatt tgtgcttttt agcctttctg ctattccttg ttttaataat 720 

gcttattata ttttggtttt cactcgaaat ccaggatcta gaagaacctt gtaccaaagt 780 

ctaaacgaac atg aaa ctt etc att gtt ttg act tgt att tct eta tgc 829 
Met Lys Leu Leu lie Val Leu Thr cys He ser Leu cys 
1 5 10 

tin £x 9 ,c ril £ 9C ?, ta cag cgc t 9 t 9 ca tct aat aaa <=ct cat 877 
Ser cys He Cys Thr val Val Gin Arg cys Ala ser Asn Lys Pro His 
15 20 25 

gtg ctt gaa gat cct tgt aag gta caa cac taggggtaat acttatagca 927 
vaT Leu Glu Asp Pro Cys Lys val Gin His *.«y«-« 

ctgcttggct ttgtgctcta ggaaaggttt taccttttca tagatggcac actatggttc 987 

aaacatgeae acctaatgtt actatcaact gtcaagatcc agctggtggt gegcttatag 1047 

ctaggtgttg gtaccttcat gaaggtcacc aaactgctgc atttagagac gtacttgttg 1107 

ttttaaataa acgaacaaat taaaatgtct gataatggac cccaatcaaa ecaaegtagt 1167 

gccccccgca ttacatttgg tggacccaca gattcaactg acaataacca gaatggagga 1227 

C9ca 1231 

<2_10> _2„8_ _._ 

<211> 39 

<212> PRT 

<213> CORONAVIRUS 

<400> 28 

Met Lys Leu Leu lie val Leu Thr cys lie Ser Leu Cys ser cys He 
1 5 10 15 

Cys Thr val Val Gin Arg Cys Ala ser Asn Lys Pro His val Leu Glu 
20 25 30 



Asp Pro cys Lys val Gin His 
35 
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<210> 29 

<211> 1231 

<212> DNA 

<213> CORONAVIKUS 

<220> 

<221> CDS 

<222> (876) . . (1127) 

<223> 



<400> 29 
taccgtattg 


gaaactataa 


attaaataca 


gaccacgccg 


gtagcaacga caatattget 


60 




ttgctagtac 


agtaagtgac 


aacagatgtt 


tcatcttgtt 


gacttccagg ttacaatagc 


120 




agagatattg 


attatcatta tgaggacttt 


caggattgct 


atttggaatc ttgacgrtat 


180 




aataagttca 


atagtgagac 


aattatttaa 


gcctctaact 


aagaagaatt atteggagtt 


240 


>- 


agatgatgaa 


gaacctatgg agttagatta 


tccataaaac 


gaacatgaaa attattctct 


300 




tcctgacatt 


gattgtattt 


acatcttgcg 


agctatatca 


ctatcaggag tgtgttagag 


360 




gtacgactgt 


actactaaaa 


gaaccttgcc 


catcaggaac 


atacgagggc aattcaccat 


420 


!* 


ttcaccctct 


tgctgacaat 


aaatttgcac 


taacttgcac 


tagcacacac tttgcttttg 


480 




cttgtgctga 


cggtactcga 


catacctatc 


agctgcgtgc 


aagatcagtt tcaccaaaac 


540 




ttttcatcag 


-acaagaggag 


gttcaacaag 


agctctactc 


gecacttttt ctcattgttg 


600 




ctgctctagt 


atttttaata 


ctttgcttca 


ccattaagag 


aaagacagaa tgaatgagct 


660 




cactttaatt 


gacttctatt 


tgtgcttttt 


agcctttctg 


ctattccttg ttttaataat 


720 




gcttattata 


ttttggtttt 


cactcgaaat 


ccaggatcta 


gaagaacctt gtaccaaagt 


780 




ctaaacgaac 


atgaaacttc 


tcattgtttt 


gacttgtatt 


tetctatgea gttgcatatg 


840 




cactgtagta 


cagcgctgtg 


catctaataa 


acctc atg tgc ttg aag ate ctt 
Met Cys Leu Lys He Leu 
1 5 


893 





gta agg tac aac act agg gat aat act tat age act get tgg ctt tgt 941 
val Arg Tyr Asn Thr Arg Gly Asn Thr Tyr Ser Thr Ala Trp Leu cys 
10 15 20 

get eta gga aag gtt tta cct ttt cat aga tgg cac act atg gtt caa 989 
Ala Leu Gly Lys val Leu Pro Phe His Arg Trp His Thr Met Val Gin 
25 30 ~ 35 

aca tgc aca cct aat gtt act ate aac tgt caa gat cca get ggt gqt 1037 
Thr Cys Thr Pro Asn Val Thr lie Asn Cys Gin Asp Pro Ala Gly Gly 
40 45 50 

gcg ctt ata get agg tgt tgg tac ctt cat gaa ggt cac caa act get 1085 
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Ala Leu He Ala Arg Cys Trp Tyr Leu His Glu Gly His Gin Thr Ala 
55 60 65 70 

gca ttt aga gac gta ctt gtt gtt tta aat aaa cga aca aat 1127 
Ala Phe Arg Asp val Leu val val Leu Asn Lys Arg Thr Asn 
75 80 

taaaatgtct gataatggac cccaatcaaa ccaacgtagt gccccccgca ttacatttgg 1187 

tggacccaca gattcaactg acaataacca gaatggagga cgca 1231 



<210> 


30 


<211> 


84 


<212> 


PRT 


<213> 


CORONAVIRUS 


<400> 


30 



Met Cys Leu Lys He Leu val Arg Tyr Asn Thr Arg Gly Asn Thr Tyr 
15 10 15 

Ser Thr Ala Trp Leu Cys Ala Leu Gly Lys val Leu Pro Phe His Arq 
20 25 30 

Trp His Thr Met Val Gin Thr Cys Thr Pro Asn Val Thr lie Asn cys 
35 40 45 

Gin Asp Pro Ala Gly Gly Ala Leu lie Ala Arg cys Trp Tyr Leu His 
50 55 60 

Glu Gly His Gin Thr Ala Ala Phe Arg Asp val Leu val val Leu Asn 
65 70 " 75 80 

Lys Arg Thr Asn 



<210> 31 

<2U> 21221 

<212> DNA 

<213> CORONAVIRUS 

<400> 31 

atggagagcc ttgttcttgg tgtcaacgag aaaacacacg tccaactcag tttgcctgtc 60 

cttcaggtta gagacgtgct agtgcgtggc ttcggggact ctgtggaaga ggccctatcg 120 

gaggcacgtg aacacctcaa aaatggcact tgtggtctag tagagctgga aaaaggcgta 180 

ctgccccagc ttgaacagcc ctatgtgttc attaaacgtt ctgatgcctt aagcaccaat 240 

cacggccaca aggtcgttga gctggttgca gaaatggacg gcattcagta cggtcgtagc 300 
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aatataacac 

y y i. a l ci a v_ ca. v_ 


taaaaatact 

L LJ L* LJ LA *— L. 


cgtgccacat 


qtqqqcqaaa 


ccccaattgc 


atacegcaat 


360 


attcttcttc 

y L L l» v_ v_ v_* l- 


ataaaaacaa 


taataaggga 


qccqqtqqtc 


atagctatgg 


catcgatcta 


420 


aaatcttata 


acttaaataa 


caaqcttaqc 


actgatccca 


ttgaagatta 


tgaacaaaac 


480 


Ly y aaLaL La 


aacataacaa 


tggtgcactc 


cgtgaactca 


ctegtgaget 


caatggaggt 


540 


nrantrartr 


nrtatatcaa 

y L l c* Ly l Ly a 


caacaat l tc 


t:a taacccaa 

V4 L. Vj "L- LA "Lj 


atgggtaccc 


tettgattge 


600 


d L Laact yet l_ L 


ttrtroraro 

1, L V— LV.yLaV.y 




"tcaata "taca 


c "tct t tccaa 


acaacttqat 


660 




f n "3 si n a n a nn 
Lyddydydyy 


1" nl" rt* a c t" a c 

L. y LL LttL LyL 


y y Lyc*LL 


ataaaca taa 


aattacctaa 


720 


L LLdL Lycty t. 


yv_ LL t_y Q Laa 


yay l, LoLyay 


caccaoacac 

LOLLUyuLaL 


ccttcaaaat 

V— "L»» L L V* "LJ LA LA LA. L 


taaaaatacc 


780 


ctdy dcld L L ty 


a f* a ft"*t*1" f 5i a 

dLdL L l- LLdd 


annnnaatar 

ciyy yy aa LyL 


ccaaaottto 

LLaaay «- wy 


tatttcctct 

L y L L L w V- W. X— V_ 


taactcaaaa 


840 


y LLaaay twa 


1" 1" r* a 5i f f a r* n 

V. L LdaL La Ly 


tattaaaaao 

v. y c Ly aaaay 


aaaaaaacta 


aaaatttcat 

W* XJ \4 w| L> L L *L-» ♦L* V» 


aaaacatata 


900 


rnr1*rtnt*n+ 

v_y LLLLyLy L 


51 f* f* ft" fl 1* 1" fl f 
aLLL t_y L LyL 


5i t" ft - f ra pa a 

a l l l l l a l a y 


fjaat*a*taaca 

y cvy ^~y *»« w lu 


atatacactt 

LL WW l#y V. lw 


atctacctta 

Vj L. V LLiLL> L WV| 


960 


ex Ly aaa i_y Ld 


atrattacaa 

cl i_ La l. l y Ly a 


taaaatttca 


yy y y 


gegactttet 


gaaagecact 


1020 


L y Ly aava l. L 


ntaaractna 

y Lyy LaL Lyc* 


aaatttaatt 

UUCi <w \_ V LA V| "L» W 


a "t "taaaaaac 


ctactacatg 


tgggtaccta 


1080 


fft*5i rtaalri 

L LdL L«a l y 


ft* n t a nt oa a 

l L.y l a. y Lyaa 


aaT acca "ta *t 


cctacc ta tc 


aagacccaga 


aattaaacct 


1140 


fi5inf"5i"t~5ifi"t'fi 
ydy La Lay iy 


i" 1" fl f* 51 fl 51 1" i - 51 
L LyLaya L. La 


tracaar car 

LLuLuuLLuL 


traaacat *ta 


aaactcaact 


ccacaaaaaa 

L.L.yv,aayyyt* 


1200 


fifi"t"5ififi5i ft*5i 
yy LdyydL Let 


fl 51 1" fl *t* "t* t" t* n n 

yd Ly lll ^yy 


5i a n c t* o 1" o "t n 

«y y l Ly Ly Ly 


"t "t ■ a r c t* a "t a 

i— w Ly ll i- y 


ttaactacta 

*- uy yv w.yv» 


taataaacat 

L. LA LA V. LA LA yj y, Vj L- 


1260 


gcLiac L.yyy 


1~ +• f c "t" f n + n r* 

L LLL LLy LyL 


1~ 5i n 1* n ft" fi 51 i~ 
Lay LyL Ly a l 


a ofjci* r a a 

ci l Ly y l i_ Lay 


y L L a uaL Lyy 


cattactdat 

lo. l LaL l y y l 


1320 


yaLad Ly Ly y 


51 fl 51 C C "T 1" fl 51 51 
dydLL L Lydd 


t* fl51 flfl 51 *P ft" c 

Lyayya ll ll 


rttaaaatac 

l l Ly ay a t_ a l 


l y ay LLy Ly a 


acatattaac 

O.Lyj Ly L LttUL 


1380 


>4- +- *a ^ -4--f- f~t 
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gctcaaagca 
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2160 


atacgtggca 


aggagcagct 


gcaactactc 


atgectctta 


aggcaccaaa 


agaagtaacc 


2220 


tttcttgaag 


gtgattcaca 


tgacacagta 


cttacctctg 


aggaggttgt 


tctcaagaac 


2280 


ggtgaactcg 


aagcactcga 


gacgcccgtt 


gatagcttca 


caaatggagc 


tatcgttggc 
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acaccagtct gtgtaaatgg cctcatgctc ttagagatta aggacaaaga acaatactgc 2400 

gcattgtctc ctggtttact ggctacaaac aatgtctttc gcttaaaagg gggtgcacca 2460 

attaaaggtg taacctttgg agaagatact gtttgggaag ttcaaggtta caagaatgtg 2520 

agaatcacat ttgagcttga tgaacgtgtt gacaaagtgc ttaatgaaaa gtgctctgtc 2580 

tacactgttg aatccggtac cgaagttact gagtttgcat gtgttgtagc agaggctgtt 2640 

gtgaagactt tacaaccagt ttctgatctc cttaccaaca tgggtattga tcttgatgag 2700 

tggagtgtag ctacattcta cttatttgat gatgctggtg aagaaaactt ttcatcacgt 2760 

atgtattgtt ccttttaccc tccagatgag gaagaagagg acgatgcaga gtgtgaggaa 2820 

gaagaaattg atgaaacctg tgaacatgag tacggtacag aggatgatta tcaaggtctc 2880 

cctctggaat ttggtgcctc agctgaaaca gttcgagttg aggaagaaga agaggaagac 2940 

tggctggatg atactactga gcaatcagag attgagccag aaccagaacc tacacctgaa 3000 

gaaccagtta atcagtttac tggttattta aaacttactg acaatgttgc cattaaatgt 3060 

gttgacatcg ttaaggaggc acaaagtgct aatcctatgg tgattgtaaa tgctgctaac 3120 

atacacctga aacatggtgg tggtgtagca ggtgcactca acaaggcaac caatggtgcc 3180 

atgcaaaagg agagtgatga ttacattaag ctaaatggcc ctcttacagt aggagggtct 3240 

tgtttgcttt ctggacataa tcttgctaag aagtgtctgc atgttgttgg acctaaccta 3300 

aatgcaggtg aggacatcca gcttcttaag gcagcatatg aaaatttcaa ttcacaggac 3360 

atcttacttg caccattgtt gtcagcaggc atatttggtg ctaaaccact tcagtcttta 3420 

caagtgtgcg tgcagacggt tcgtacacag gtttatattg cagtcaatga caaagctctt 3480 

tatgagcagg ttgtcatgga ttatcttgat aacctgaagc ctagagtgga agcacctaaa 3540 

caagaggagc caccaaacac agaagattcc aaaactgagg agaaatctgt cgtacagaag 3600 

cctgtcgatg tgaagccaaa aattaaggcc tgcattgatg aggttaccac aacactggaa 3660 

gaaactaagt ttcttaccaa taagttactc ttgtttgctg aratcaatgg taagctttac 3720 

catgattctc agaacatgct tagaggtgaa gatatgtctt tccttgagaa ggatgcacct 3780 

tacatggtag gtgatgttat cactagtggt gatatcactt gtgttgtaat accctccaaa 3840 

aaggctggtg gcactactga gatgctctca agagctttga agaaagtgcc agttgatgag 3900 

tatataacca cgtaccctgg acaaggatgt gctggttata cacttgagga agctaagact 3960 

gctcttaaga aatgcaaatc tgcattttat gtactacctt cagaagcacc taatgctaag 4020 

gaagagattc taggaactgt atcctggaat ttgagagaaa tgcttgctca tgctgaagag 4080 

acaagaaaat taatgcctat atgcatggat gttagagcca taatggcaac catccaacgt 4140 

aagtataaag gaattaaaat tcaagagggc atcgttgact atggtgtccg attcttcttt 4200 

tatactagta aagagcctgt agcttctatt attacgaagc tgaactctct aaatgagccg 4260 

cttgtcacaa tgccaattgg ttatgtgaca catggtttta atcttgaaga ggctgcgcgc 4320 

tgtatgcgtt ctcttaaagc tcctgccgta gtgtcagtat catcaccaga tgctgttact 4380 
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acatataatg 
gtttctttgg 
gttgaatttc 
tttcatcttg 
gaggttaaga 
gtggatatgt 
gttacaaaaa 
gatgacacac 
ggtaggtaca 
ttaacttcaa 
caacagcttg 
gctggtgatg 
gagcttggtg 
gcaaagcgag 
ggtgtagaag 
tccattccat 
tttgttatga 
gcgaatgagt 
accctctatc 
actgatgttt 
ctcgatggag 
aatgcttact 
agttrtgata 
atgacaggct 
aatggcgatg 
aaattactgc 
aaaccaaaca 
tcatttgaag 
caacaaccca 
tgtgacgtga 
gttaaagtaa 
agcattacca 
actcatggta 
ccattcttag 



gatacctcac 
ctggctctta 
ttaagcgtgg 
acggtgaggt 
ctataaaagt 
ctatgacata 
ttaaacctca 
tacgtagtga 
tgtctgcttt 
ttaaatgggc 
aagtcaaatt 
ctgctaactt 
atgtcagaga 
ttcttaatgt 
ctgtgatgta 
gtgtgtgtgg 
tgtctgcacc 
acactggtaa 
gtattgacgg 
tctacaagga 
ttacttacac 
atacagagca 
atttcaaact 
tcacaaagcc 
tagtggctat 
ataagccaat 
cttggtgttt 
ttctggcagt 
cctctgaaga 
aaactaccga 
cacaagagtt 
ttaagaaacc 
ttgctgcaat 
gacaagcagc 



ttcgtcatca 
cagagattgg 
tgacaaaatt 
tctttcactt 
gttcacaact 
tggacagcag 
tgtaaatcat 
agctttcgag 
aaaccacaca 
tgataacaat 
caatgcacca 
ttgtgcactc 
aactatgacc 
ggtgtgtaaa 
tatgggtact 
tcgtgatgct 
acctgctgag 
ctatcagtgt 
agctcacctt 
aacatcttac 
agagattgaa 
gcctatagac 
cacatgttct 
agcttcacga 
tgactataga 
tgtttggcac 
acgttgtctt 
agaagacaca 
agtagtggaa 
agttgtaggc 
aggtcatgag 
taatgagctt 
taatagtgtt 
aattacaaca 
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aagacatctg 
tcctattcag 
gtgtaccaca 
gacaaactaa 
gtggacaaca 
tttggtccaa 
gagggtaaga 
tactaccata 
aagaaatgga 
-tgttatttgt 
gcacttcaag 
atactcgctt 
catcttctac 
cattgtggtc 
ctatcttatg 
acacaatatc 
tataaattac 
ggtcattaca 
acaaagatgt 
actacaacca 
ccaaaattgg 
cttgtaccaa 
aacacaaaat 
gagctatctg 
cactattcag 
attaaccagg 
tggagtacaa 
caaggaatgg 
aatcctacca 
aatgtcatac 
gatcttatgg 
tcactagcct 
ccttggagta 



tcaaattgcg 
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aggagcactt 
gacagcgtac 
ctctggagag 
agagtctctt 
ctaatctcca 
catacttgga 
ctttctttgt 
ctcttgatga 
aatttcctca 
ctagtgtttt 
aggcttatta 
acagtaataa 
agcatgctaa 
agaaaactac 
ataatcttaa 
tagtacaaca 
agcaaggtac 
ctcatataac 
cagagtacaa 
tcaagcctgt 
atgggtatta 
ctcaaccatt 
ttgctgatga 
tcacattctt 
cgagtttcaa 
ctacaaccaa 
agccagtaga 
acaatcttgc 
tacagaagga 
ttaaaccatc 
ctgcttatgt 
taggtttaaa 
aaattttggc 
ctaagagatt 



tgtagaaaca 

agagttaggt 

ccccgtcgag 

atccctgcgg 

cacacagctt 

tggtgctgat 

actacctagt 

gagttttctt 

agttggtggt 

attagcactt 

tagagcccgt 

aactgttggc 

tttggaatct 

taccttaacg 

gacaggtgtt 

agagtcttct 

attcttatgt 

tgctaaggag 

aggaccagtg 

gtcgtataaa 

taaaaaggat 

accaaatgcg 

tttaaatcaa 

cccagacttg 

gaaaggtgct 

gacaacgttc 

tacttcaaat 

ttgtgaaagt 

agtcatagag 

agatgaaggt 

ggaaaacaca 

aacaattgcc 

ttatgtcaaa 

agcacaacgt 



4440 

4500 

4560 

4620 

4680 

4740 

4800 

4860 

4920 

4980 

5040 

5100 

5160 

5220 

5280 

5340 

5400 

5460 

5520 

5580 

5640 

5700 

5760 

5820 

5880 

5940 

6000 

6060 

6120 

6180 

6240 

6300 

6360 

6420 
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gtgtttaaca 


attatatgcc 


ttatgtgttt 


acattattgt 


tccaattgtg tacttttact 


6480 


aaaagtacca 


attctagaat 


tagagcttca 


ctacctacaa ctattgctaa aaatagtgtt 


6540 


aagagtgttg 


ctaaattatg 


tttggatgcc 


ggcattaatt 


atgtgaagtc acccaaattt 


6600 


tctaaattgt 


tcacaatcgc 


tatgtggcta 


ttgttgttaa 


gtatttgctt aggttctcta 


6660 


atctgtgtaa 


ctgctgcttt 


tggtgtactc 


ttatctaatt ttggtgctcc ttcttattgt 


6720 


aatggcgtta 


gagaattgta 


tcttaattcg 


tctaacgtta 


ctactatgga tttctgtgaa 


6780 


ggttcttttc 


cttgcagcat 


ttgtttaagt 


ggattagact 


cccttgattc ttatccagct 


6840 


cttgaaacca 


ttcaggtgac 


gatttcatcg 


tacaagctag 


acttgacaat tttaggtctg 


6900 


gccgctgagt 


gggttttggc 


atatatgttg 


ttcacaaaat 


tcttttattt attaggtctt 


6960 


tcagctataa 


tgcaggtgtt 


ctttggctat 


tttgctagtc 


atttcatcag caattcttgg 


7020 


ctcatgtggt 


ttatcattag 


tattgtacaa 


atggcacccg 


tttctgcaat ggttaggatg 


7080 


tacatcttct 


ttgcttcttt 


ctactacata 


tggaagagct 


atgttcatat catggatggt 


7140 


tgcacctctt 


cgacttgcat 


gatgtgctat 


aagcgcaatc 


gtgccacacg cgttgagtgt 


7200 


acaactattg 


ttaatggcat 


gaagagatct 


ttctatgtct 


atgcaaatgg aggccgtggc 


7260 


ttctgcaaga 


ctcacaattg 


gaattgtctc 


aattgtgaca 


cattttgcac tggtagtaca 


7320 


ttcattagtg 


atgaagttgc 


tcgtgatttg 


tcactccagt ttaaaagacc aatcaaccct 


7380 


actgaccagt 


catcgtatat 


tgttgatagt 


gttgctgtga 


aaaatggcgc gcttcacctc 


7440 


tactttgaca 


aggctggtca 


aaagacctat 


gagagacatc 


cgctctccca ttttgtcaat 


7500 


ttagacaatt 


tgagagctaa 


caacactaaa 


ggttcactgc 


ctattaatgt catagttttt 


7560 


gatggcaagt 


ccaaatgcga 


cgagtctgct 


tctaagtctg 


cttctgtgta ctacagtcag 


7620 


ctgatgtgcc 


aacctattct 


gttgcttgac 


caagctcttg 


tatcagacgt tggagatagt 


7680 


actgaagttt 


ccgttaagat 


gtttgatgct 


tatgtcgaca 


ccttttcagc aacttttagt 


7740 


gttcctatgg 


aaaaacttaa 


ggcacttgtt 


gctacagctc 


acagcgagtt agcaaagggt 


7800 


gtagctttag 


atggtgtcct 


ttctacattc 


gtgtcagctg 


cccgacaagg tgttgttgat 


7860 


accgatgttg 


acacaaagga 


tgttattgaa 


tgtctcaaac 


tttcacatca ctctgactta 


7920 


gaagtgacag 


gtgacagttg taacaatttc 


atgctcacct 


ataataaggt tgaaaacatg 


7980 


acgcccagag 


atcttggcgc atgtattgac 


tgtaatgcaa ggcatatcaa tgcccaagta 


8040 


gcaaaaagtc 


acaatgtttc actcatctgg 


aatgtaaaag actacatgtc tttatctgaa 


8100 


cagctgcgta 


aacaaattcg tagtgctgcc 


aagaagaaca acataccttt tagactaact 


8160 


x.g ugctacaa 


ctagacaggt 


tgtcaatgtc 


ataactacta 


aaatctcact caagggtggt 




aagattgtta 


gtacttgttt taaacttatg 


cttaaggcca 


cattattgtg cgttcttgct 


8280 


gcattggttt 


gttatatcgt tatgccagta 


catacattgt 


caatccatga tggttacaca 


8340 


aatgaaatca 


ttggttacaa 


agccattcag 


gatggtgtca 


ctcgtgacat catttctact 


8400 


gatgattgtt 


ttgcaaataa 


acatgctggt 


tttgacgcat ggtttagcca gcgtggtggt 
Page 54 


8460 



tcatacaaaa 
ttcatagtgc 
tttctacctc 
gagtatagtg 
gatgctatgg 
tcttatagtg 
tttcctaaca 
tgtagacatg 
tgggttctta 
atgaatctca 
tctgcttcag 
tttatgaaat 
ttgtttttga 
gtctactcag 
gctcaccttc 
tatgtattct 
agagtcatgt 
ttgctcaaca 
tataacaggt 
accagctatc 
ncaggtgctg 
agtggtttta 
acctgtggaa 
catgtcattt 
aaatccaacc 
tctatgcaaa 
tataaatttg 
tcaccatctg 
cttaatggat 
tatatgcatx 
ttctatggtc 
acattaaatg 
aatagattca 
cctttgacac 



atgacaaaag 
ctggcttacc 
gtgtttttag 
attttgctac 
gcaaacctgt 
agcttcgtcc 
cttacctgga 
gtacatgcga 
ataatgagca 
tagctaacat 
tagtggctgg 
tcagacgtgt 
tgtctttcac 
tcttttactt 
aatggtttgc 
gtatttctct 
ttaatggagt 
aggaaatgta 
atcttgctct 
gtgaagcagc 
atgttctcta 
ggaaaatggc 
ctacaactct 
gcacagcaga 
atagctttct 
attgtctgct 
tccgtatcca 
gtgtttatca 
catgtggtag 
atatggagct 
catttgttga 
ttttggcatg 
ccactacttt 
aagatcatgt 



ctgccctgta 
gggtactgtg 
tgctgttggc 
ctctgcttgc 
gccatattgt 
agacactcgt 
gggttctgtt 
aaggtcagaa 
ttacagagct 
ctttactcct 
tggtattatt 
ttttggtgag 
tatactctgt 
gtacttgaca 
catgttttct 
gaagcactgc 
tacatttagt 
cctaaaattg 
atataacaag 
ttgctgccac 
ccaaccacca 
attcccgtca 
taatggattg 
agacatgctt 
tgttcaggct 
taggcttaaa 
acctggtcaa 
gtgtgccatg 
tgttggtttt 
tccaacagga 
cagacaaact 
gctgtatgct 
gaatgacttt 
tgacatattg 
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gtagctgcta tcattacaag 
ctgagagcaa tcaatggtga 
aacatttgct acacaccttc 
gttcttgctg ctgagtgtac 
tatgacacta atttgctaga 
tatgtgctta tggatggttc 
agagtagtaa caacttttga 
gtaggtattt gcctatctac 
ctatcaggag ttttctgtgg 
cttgtgcaac ctgtgggtgc 
gccatattgg tgacttgtgc 
tacaaccatg ttgttgctgc 
ctggtaccag cttacagctt 
ttctatttca ccaatgatgt 
cctattgtgc ctttttggat 
cattggttct ttaacaacta 
accttcgagg aggctgcttt 
cgtagcgaga cactgttgcc 
tacaagtatt tcagtggagc 
ttagcaaagg ctctaaatga 
cagacatcaa tcacttctgc 
ggcaaagttg aagggtgcat 
tggttggatg acacagtata 
aatcctaact atgaagatct 
ggcaatgttc aacttcgtgt 
gttgatactt ctaaccctaa 
acattttcag ttctagcatg 
agacctaatc ataccattaa 
aacattgatt atgattgcgt 
gtacacgctg gtactgactt 
gcacaggctg caggtacaga 
gctgttatca atggtgatag 
aaccttgtgg caatgaagta 



ggacctcttt ctgctcaaac 
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agagattggt 
cttcttgcat 
caaactcatt 
aatttttaag 
gggttctatt 
catcatacag 
tgctgagtac 
cagtggtaga 
tgttgatgcg 
trtagatgtg 
tgcctactac 
taatgcactt 
tctgccggga 
ttcattcttg 
aacagcaatc 
tcttaggaaa 
gtgtaccttt 
acttacacag 
cttagatact 
ctttagcaac 
tgttctgcag 
ggtacaagta 
ctgtccaaga 
gctcattcgc 
tattggccat 
gacacccaag 
ctacaatggt 
aggttctttc 
gtctttctgc 
agaaggtaaa 
cacaaccata 
gtggtttctt 
caactatgaa 
aggaattgcc 



8520 
8580 
8640 
8700 
8760 
8820 
8880 
8940 
9000 
9060 
9120 
9180 
9240 
9300 
9360 
9420 
9480 
9540 
9600 
9660 
9720 
9780 
9840 
9900 
9960 
10020 
10080 
10140 
10200 
10260 
10320 
10380 
10440 
10500 
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gtcttagata tgtgtgctgc tttgaaagag ctgctgcaga atggtatgaa tggtcgtact 10560 

atccttggta gcactatttt agaagatgag tttacaccat ttgatgttgt tagacaatgc 10620 

tctggtgtta ccttccaagg taagttcaag aaaattgtta agggcactca tcattggatg 10680 

cttttaactt tcttgacatc actattgatt cttgttcaaa gtacacagtg gtcactgttt 10740 

ttctttgttt acgagaatgc tttcttgcca tttactcttg gtattatggc aattgctgca 10800 

tgtgctatgc tgcttgttaa gcataagcac gcattcttgt gcttgtttct gttaccttct 10860 

cttgcaacag ttgcttactt taatatggtc tacatgcctg ctagctgggt gatgcgtatc 10920 

atgacatggc ttgaattggc tgacactagc ttgtctggtt ataggcttaa ggattgtgtt 10980 

atgtatgctt cagctttagt tttgcttatt ctcatgacag ctcgcactgt ttatgatgat 11040 

gctgctagac gtgtttggac actgatgaat gtcattacac ttgtttacaa agtctactat 11100 

ggtaatgctt tagatcaagc tatttccatg tgggccttag ttatttctgt aacctctaac 11160 

tattctggtg tcgttacgac tatcatgttt ttagctagag ctatagtgtt tgtgtgtgtt 11220 

gagtattacc cattgttatt tattactggc aacaccttac agtgtatcat gcttgtttat 11280 

tgtttcttag gctattgttg ctgctgctac tttggccttt tctgtttact caaccgttac 11340 

ttcaggctta ctcttggtgt ttatgactac ttggtctcta cacaagaatt taggtatatg 11400 

aactcccagg ggcttttgcc tcctaagagt agtattgatg ctttcaagct taacattaag 11460 

ttgttgggta ttggaggtaa accatgtatc aaggttgcta ctgtacagtc taaaatgtct 11520 

gacgtaaagt gcacatctgt ggtactgctc tcggttcttc aacaacttag agtagagtca 11580 

tcttctaaat tgtgggcaca atgtgtacaa ctccacaatg atattcttct tgcaaaagac 11640 

acaactgaag ctttcgagaa gatggtttct cttttgtctg ttttgctatc catgcagggt 11700 

gctgtagaca ttaataggtt gtgcgaggaa atgctcgata accgtgctac tcttcaggct 11760 

attgcttcag aatttagttc tttaccatca tatgccgctt atgccactgc ccaggaggcc 11820 

tatgagcagg ctgtagctaa tggtgattct gaagtcgttc tcaaaaagtt aaagaaatct 11880 

ttgaatgtgg ctaaatctga gtttgaccgt gatgctgcca tgcaacgcaa gttggaaaag 11940 

atggcagatc aggctatgac ccaaatgtac aaacaggcaa gatctgagga caagagggca 12000 

aaagtaacta gtgctatgca aacaatgctc ttcactatgc ttaggaagct tgataatgat 12060 

gcacttaaca acattatcaa caatgcgcgt gatggttgtg ttccactcaa catcatacca 12120 

ttgactacag cagccaaact catggttgtt gtccctgatt atggtaccta caagaacact 12180 

tgtgatggta acacctttac atatgcatct gcactctggg aaatccagca agttgttgat 12240 

gcggatagca agattgttca acttagtgaa attaacatgg acaattcacc aaatttggct 12300 

tggcctctta ttgttacagc tctaagagcc aactcagctg ttaaactaca gaataatgaa 12360 

ctgagtccag tagcactacg acagatgtcc tgtgcggctg gtaccacaca aacagcttgt 12420 

actgatgaca atgcacttgc ctactataac aattcgaagg gaggtaggtt tgtgctggca 12480 

ttactatcag accaccaaga tctcaaatgg gctagattcc ctaagagtga tggtacaggt 12540 
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acaatttaca cagaactgga accaccttgt aggtttgtta cagacacacc aaaagggcct 12600 

aaagtgaaat acttgtactt catcaaaggc ttaaacaacc taaatagagg tatggtgctg 12660 

ggcagtttag ctgctacagt acgtcttcag gctggaaatg ctacagaagt acctgccaat 12720 

tcaactgtgc tttccttctg tgcttttgca gtagaccctg ctaaagcata taaggattac 12780 

ctagcaagtg gaggacaacc aatcaccaac tgtgtgaaga tgttgtgtac acacactggt 12840 

acaggacagg caattactgt aacaccagaa gctaacatgg accaagagtc ctttggtggt 12900 

gcttcatgtt gtctgtattg tagatgccac attgaccatc caaatcctaa aggattctgt 12960 

gacttgaaag gtaagtacgt ccaaatacct accacttgtg ctaatgaccc agtgggtttt 13020 

acacttagaa acacagtctg taccgtctgc ggaatgtgga aaggttatgg ctgtagttgt 13080 

gaccaactcc gcgaaccctt gatgcagtct gcggatgcat caacgttttt aaacgggttt 13140 

gcggtgtaag tgcagcccgt cttacaccgt gcggcacagg cactagtact gatgtcgtict 13200 

acagggcttt tgatatttac aacgaaaaag ttgctggttt tgcaaagttc ctaaaaacta 13260 

attgctgtcg cttccaggag aaggatgagg aaggcaattt attagactct tactttgtag 13320 

ttaagaggca tactatgtct aactaccaac a^gaagagac tatttataac ttggttaaag 13380 

attgtccagc ggttgctgtc catgactttt tcaagtttag agtagatggt gacatggtac 13440 

cacatatatc acgtcagcgt ctaactaaat acacaatggc tgatttagtc tatgctctac 13500 

gtcattttga tgagggtaat tgtgatacat taaaagaaat actcgtcaca tacaattgct 13560 

gtgatgatga ttatttcaat aagaaggatt ggtatgactt cgtagagaat cctgacatct 13620 

tacgcgtata tgctaactta ggtgagcgtg tacgccaatc attattaaag actgtacaat 13680 

tctgcgatgc tatgcgtgat gcaggcattg taggcgtact gacattagat aatcaggatc 13740 

ttaatgggaa ctggtacgat ttcggtgatt tcgtacaagt agcaccaggc tgcggagttc 13800. 

ctattgtgga ttcatattac tcattgctga tgcccatcct cactttgact agggcattgg 13860 

ctgctgagtc ccatatggat gctgatctcg caaaaccact tattaagtgg gatttgctga 13920 

aatatgattt tacggaagag agactttgtc tcttcgaccg ttattttaaa tattgggacc 13980 

agacatacca tcccaattgt attaactgtt tggatgatag gtgtatcctt cattgtgcaa 14040 

actttaatgt gttattttct actgtgtttc cacctacaag ttttggacca ctagtaagaa 14100 

aaatatttgt agatggtgtt ccttttgttg tttcaactgg ataccatttt cgtgagttag 14160 

gagtcgtaca taatcaggat gtaaacttac atagctcgcg tctcagtttc aaggaacttt 14220 

tagtgtatgc tgctgatcca gctatgcatg cagcttctgg caatttattg ctagataaac 14280 

gcactacatg cttttcagta gctgcactaa caaacaatgt tgcttttcaa actgtcaaac 14340 

ccggtaattt taataaagac ttttatgact ttgctgtgtc taaaggtttc tttaaggaag 14400 

gaagttctgt tgaactaaaa cacttcttct ttgctcagga tggcaacgct gctatcagtg 14460 

attatgacta ttatcgttat aatctgccaa caatgtgtga tatcagacaa ctcctattcg 14520 

tagttgaagt tgttgataaa tactttgatt gttacgatgg tggctgtatt aatgccaacc 14580 
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aagtaatcgt taacaatctg gataaatcag ctggtttccc atttaataaa tggggtaagg 14640 

ctagacttta ttatgactca atgagttatg aggatcaaga tgcacttttc gcgtatacta 14700 

agcgtaatgt catccctact ataactcaaa tgaatcttaa gtatgccatt agtgcaaaga 14760 

atagagctcg caccgtagct ggtgtctcta tctgtagtac tatgacaaat agacagtttc 14820 

atcagaaatt attgaagtca atagccgcca ctagaggagc tactgtggta attggaacaa 14880 

gcaagtttta cggtggctgg cataatatgt taaaaactgt ttacagtgat gtagaaactc 14940 

cacaccttat gggttgggat tatccaaaat gtgacagagc catgcctaac atgcttagga 15000 

taatggcctc tcttgttctt gctcgcaaac ataacacttg ctgtaactta tcacaccgtt 15060 

nctacaggtt agctaacgag tgtgcgcaag tattaagtga gatggtcatg tgtggcggct 15120 

cactatatgt taaaccaggt ggaacatcat ccggtgatgc tacaactgct tatgctaata 15180 

gtgtctttaa catttgtcaa gctgttacag ccaatgtaaa tgcacttctt tcaactgatg 15240 

gtaataagat agctgacaag tatgtccgca atctacaaca caggctctat gagtgtctct 15300 

atagaaatag ggatgttgat catgaattcg tggatgagtt ttacgcttac ctgcgtaaac 15360 

atttctccat gatgattctt tctgatgatg ccgttgtgtg ctataacagt aactatgcgg 15420 

ctcaaggttt agtagctagc attaagaact ttaaggcagt tctttattat caaaataatg 15480 

tgttcatgtc tgaggcaaaa tgttggactg agactgacct tactaaagga cctcacgaat 15540 

tttgctcaca gcatacaatg ctagttaaac aaggagatga ttacgtgtac ctgccttacc 15600 

cagatccatc aagaatatta ggcgcaggct gttttgtcga tgatattgtc aaaacagatg 15660 

gtacacttat gattgaaagg ttcgtgtcac tggctattga tgcttaccca cttacaaaac 15720 

atcctaatca ggagtatgct gatgtctttc acttgtattt acaatacatt agaaagttac 15780 

atgatgagct tactggccac atgttggaca tgtattccgt aatgctaact aatgataaca 15840 

cctcacggta ctgggaacct gagttttatg aggctatgta cacaccacat acagtcttgc 15900 

aggctgtagg tgcttgtgta ttgtgcaatt cacagacttc acttcgttgc ggtgcctgta 15960 



ttaggagacc attcctatgt tgcaagtgct gctatgacca tgtcatttca acatcacaca 16020 

aattagtgtt gtctgttaat ccctatgttt gcaatgcccc aggttgtgat gtcactgatg 16080 

tgacacaact gtatctagga ggtatgagct attattgcaa gtcacataag cctcccatta 16140 

gttttccatt atgtgctaat ggtcaggttt ttggtttata caaaaacaca tgtgtaggca 16200 

gtgacaatgt cactgacttc aatgcgatag caacatgtga ttggactaat gctggcgatt 16260 

acatacttgc caacacttgt actgagagac tcaagctttt cgcagcagaa acgctcaaag 16320 

ccactgagga aacatttaag ctgtcatatg gtattgccac tgtacgcgaa gtactctctg 16380 

acagagaatt gcatcttrtca tgggaggttg gaaaacctag accaccattg aacagaaact 16440 

atgtctttac tggttaccgt gtaactaaaa atagtaaagt acagattgga gagtacacct 16500 

ttgaaaaagg tgactatggt gatgctgttg tgtacagagg tactacgaca tacaagttga 16560 

atgttggtga ttactttgtg ttgacatctc acactgtaat gccacttagt gcacctactc 16620 
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tagtgccaca agagcactat gtgagaatta ctggcttgta cccaacactc aacatctcag 16680 

atgagttttc tagcaatgtt gcaaattatc aaaaggtcgg catgcaaaag tactctacac 16740 

tccaaggacc acctggtact ggtaagagtc attttgccat cggacttgct ctctattacc 16800 

catctgctcg catagtgtat acggcatgct ctcatgcagc tgttgatgcc ctatgtgaaa 16860 

aggcattaaa atatttgccc atagataaat gtagtagaat catacctgcg cgtgcgcgcg 16920 

tagagtgttt tgataaattc aaagtgaatt caacactaga acagtatgtt ttctgcactg 16980 

taaatgcatt gccagaaaca actgctgaca ttgtagtctt tgatgaaatc tctatggcta 17040 

ctaattatga cttgagtgtt gtcaatgcta gacttcgtgc aaaacactac gtctatattg 17100 

gcgatcctgc tcaattacca gccccccgca cattgctgac taaaggcaca ctagaaccag 17160 

aatattttaa ttcagtgtgc agacntatga aaacaatagg tccagacatg ttccttggaa 17220 

cttgtcgccg ttgtcctgct gaaattgttg acactgtgag tgctttagtt tatgacaata 17280 

agctaaaagc acacaaggat aagtcagctc aangcttcaa aatgttctac aaaggtgtta 17340 

ttacacatga tgtttcatct gcaatcaaca gacctcaaat aggcgttgta agagaatttc 17400 

ttacacgcaa tcctgcttgg agaaaagctg tttttatctc accttataat tcacagaacg 17460 

ctgtagcttc aaaaatctta ggattgccta cgcagactgt tgattcatca cagggttctg 17520 

aatatgacta tgtcatattc acacaaacta ctgaaacagc acactcttgt aatgtcaacc 17580 

gcttcaatgt ggctatcaca agggcaaaaa ttggcatttt gtgcataatg tctgatagag 17640 

atctttatga caaactgcaa tttacaagtc tagaaatacc acgtcgcaat gtggctacat 17700 

tacaagcaga aaatgtaact ggactttrta aggactgtag taagatcatt actggtcttc 17760 

atcctacaca ggcacctaca cacctcagcg ttgatataaa gttcaagact gaaggattat 17820 

gtgttgacat accaggcata ccaaaggaca tgacctaccg tagactcatc tctatgatgg 17880 

gtttcaaaat gaattaccaa gtcaatggtt accctaatat gtttatcacc cgcgaagaag 17940 

ctattcgtca cgttcgtgcg tggattggct ttgatgtaga gggctgtcat gcaactagag 18000 

atgctgtggg tactaaccta cctctccagc taggattttc tacaggtgtt aacttagtag 18060 

ctgtaccgac tggttatgtt gacactgaaa ataacacaga attcaccaga gttaatgcaa 18120 

aacctccacc aggtgaccag tttaaacatc ttataccact catgtataaa ggcttgccct 18180 

ggaatgtagt gcgtattaag atagtacaaa tgctcagtga tacactgaaa ggattgtcag 18240 

acagagtcgt gttcgtcctt tgggcgcatg gctttgagct tacatcaatg aagtactttg 18300 

tcaagattgg acctgaaaga acgtgttgtc tgtgtgacaa acgtgcaact tgcttttcta 18360 

cttcatcaga tacttatgcc tgctggaatc attctgtggg ttttgactat gtctataacc 18420 

catttatgat tgatgttcag cagtggggct ttacgggtaa ccttcagagt aaccatgacc 18480 

aacattgcca ggtacatgga aatgcacatg tggctagttg tgatgctatc atgactagat 18540 

gtttagcagt ccatgagtgc tttgttaagc gcgttgattg gtctgttgaa taccctatta 18600 

taggagatga actgagggtt aattctgctt gcagaaaagt acaacacatg gttgtgaagt 18660 
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ctgcattgct tgctgataag tttccagttc ttcatgacat tggaaatcca aaggctatca 18720 

agtgtgtgcc tcaggctgaa gtagaatgga agttctacga tgctcagcca tgtagtgaca 18780 

aagcttacaa aatagaggaa ctcttctatt cttatgctac acatcacgat aaattcactg 18840 

atggtgtttg tttgttttgg aattgtaacg ttgatcgtta cccagccaat gcaattgtgt 18900 

gtaggtttga cacaagagtc ttgtcaaact tgaacttacc aggctgtgat ggtggtagtt 18960 

tgtatgtgaa taagcatgca ttccacactc cagctttcga taaaagtgca tttactaatt 19020 

taaagcaatt gcctttcttt tactattctg atagtccttg tgagtctcat ggcaaacaag 19080 

tagtgtcgga tattgattat gttccactca aatctgctac gtgtattaca cgatgcaatt 19140 

taggtggtgc tgtttgcaga caccatgcaa atgagtaccg acagtacttg gatgcatata 19200 

atatgatgat ttctgctgga tttagcctat ggatttacaa acaatttgat acttataacc 19260 

tgtggaatac atttaccagg ttacagagtt tagaaaatgt ggcttataat gttgttaata 19320 

aaggacactt tgatggacac gccggcgaag cacctgtttc catcattaat aatgctgttt 19380 

acacaaaggt agatggtatt gatgtggaga tctttgaaaa taagacaaca cttcctgtta 19440 

atgttgcatt tgagctttgg gctaagcgta acattaaacc agtgccagag attaagatac 19500 

tcaataattt gggtgttgat atcgctgcta atactgtaat ctgggactac aaaagagaag 19560 

ccccagcaca tgtatctaca ataggtgtct gcacaatgac tgacattgcc aagaaaccta 19620 

ctgagagtgc ttgttcttca cttactgtct tgtttgatgg tagagtggaa ggacaggtag 19680 

acctttttag aaacgcccgt aatggtgttt taataacaga aggttcagtc aaaggtctaa 19740 

caccttcaaa gggaccagca caagctagcg tcaatggagt cacattaatt ggagaatcag 19800 

taaaaacaca gtttaactac tttaagaaag tagacggcat tattcaacag ttgcctgaaa 19860 

cctactttac tcagagcaga gacttagagg attttaagcc cagatcacaa atggaaactg 19920 

actttctcga gctcgctatg gatgaattca tacagcgata taagctcgag ggctatgcct 19980 

tcgaacacat cgtttatgga gatttcagtc atggacaact tggcggtctt catttaatga 20040 

taggcttagc caagcgctca caagattcac cacttaaatt agaggatttt atccctatgg 20100 

acagcacagt gaaaaattac ttcataacag atgcgcaaac aggttcatca aaatgtgtgt 20160 

gttctgtgat tgatctttta cttgatgact ttgtcgagat aataaagtca caagatttgt 20220 

cagtgatttc aaaagtggtc aaggttacaa ttgactatgc tgaaatttca ttcatgcttt 20280 

ggtgtaagga tggacatgtt gaaaccttct acccaaaact acaagcaagt caagcgtggc 20340 

aaccaggtgt tgcgatgcct aacttgtaca agatgcaaag aatgcttctt gaaaagtgtg 20400 

accttcagaa ttatggtgaa aatgctgtta taccaaaagg aataatgatg aatgtcgcaa 20460 

agtatactca actgtgtcaa tacttaaata cacttacttt agctgtaccc tacaacatga 20520 

gagttattca ctttggtgct ggctctgata aaggagttgc accaggtaca gctgtgctca 20580 

gacaatggtt gccaactggc acactacttg tcgattcaga tcttaatgac ttcgtctccg 20640 

acgcagattc tactttaatt ggagactgtg caacagtaca tacggctaat aaatgggacc 20700 
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ttattattag 

aagaagggtt 

ctatagctgt 

atttctcatg 

taattggggc 

ctaactacat 

acatgagcaa 

aaatcaatga 

acagagttgt 



cgatatgtat 
tttcacttat 
aaagataaca 
gtggacagct 
taactatctt 
tttctggagg 
atttcctctt 
tatgatttat 
ggtttcaagt 



gaccctagga 
ctgtgtggat 
gagcattctt 
tttgttacaa 
ggcaagccga 
aacacaaatc 
aaattaagag 
tctcttctgg 
gatattcttg 



S226CAS108. 
ccaaacatgt 
ttataaagca 
ggaatgctga 
atgtaaatgc 
aggaacaaat 
ctatccagtt 
gaactgctgt 
aaaaaggtag 
ttaacaacta 



ST25 

gacaaaagag 
aaaactagcc 
cctttacaag 
atcatcatcg 
tgatggctat 
gtcttcctat 
aatgtctctt 
gcttatcatt 



aatgactcta 
ctgggtggtt 
cttatgggcc 
gaagcatttt 
accatgcatg 
tcactctttg 
aaggagaatc 
agagaaaaca 



20760 
20820 
20880 
20940 
21000 
21060 
21120 
21180 
21221 



<210> 32 

<211> 297 

<212> DNA 

<213> CORONAVIRUS 

Jjggacccca atcaaaccaa cgtagtgccc cccgcattac atttggtgga cccacagatt 
caactgacaa taaccagaat ggaggacgca atggggcaag gccaaaacag cgccgacccc 
aaggtttacc caataatact gcgtcttggt tcacagctct cactcagcat ggcaaggagg 
aacttagatt ccctcgaggc cagggcgttc caatcaacac caatagtggt ccagatgacc 
aaattggcta ctaccgaaga gctacccgac gagttcgtgg tggtgacggc aaaatga 

<210> 33 

<211> 98 

<212> PRT 

<213> CORONAVIRUS 



60 
120 
180 
240 
297 



<400> 33 



Met Asp Pro Asn Gin Thr Asn val Val Pro Pro Ala Leu His Leu Val 



10 



Asp Pro Gin He Gin Leu Thr lie Thr Arg Met Glu Asp Ala Met Gly 
K 20 25 30 

Gin Gly Gin Asn ser Ala Asp Pro Lys val Tyr Pro lie lie Leu Arg 
35 40 45 

Leu Gly ser Gin Leu Ser Leu ser Met Ala Arg Arg Asn Leu Asp ser 
50 55 60 

page 61 



1er depot 



S226CAS108.ST25 

Leu Glu Ala Arg Ala Phe Gin Ser Thr Pro lie Val val Gin Met Thr 
65 70 75 80 

Lys Leu Ala Thr Thr Glu Glu Leu Pro Asp Glu Phe val Val val Thr 
85 90 95 

Ala Lys 



<210> 34 

<211> 213 

<212> DNA 

<213> CORONAVIRUS 



<400> 34 

atgctgccac cgtgctacaa cttcctcaag gaacaacatt gccaaaaggc ttctacgcag 60 

agggaagcag aggcggcagt caagcctctt ctcgctcctc atcacgtagt cgcggtaatt 120 

caagaaattc aactcctggc agcagtaggg gaaattctcc tgctcgaatg gctagcggag 180 

gtggtgaaac tgccctcgcg ctattgctgc tag 213 

<210> 35 

<211> 70 

<212> PRT 

<213> CORONAVIRUS 

<400> 35 

Met-4ieu-Pr^^r0-€y5--Tyr^^n-Phe-L-eu Lys Gl-u-Gln-His-eys-Gln Lys 
1 5 10 15 

Ala Ser Thr Gin Arg Glu Ala Glu Ala Ala val Lys Pro Leu Leu Ala 
20 25 30 

Pro His His Val Val Ala Val lie Gin Glu lie Gin Leu Leu Ala Ala 
35 40 45 

val Gly Glu lie Leu Leu Leu Glu Trp Leu Ala Glu val val Lys Leu 
50 55 60 

Pro Ser Arg Tyr cys Cys 
65 70 



<210> 36 
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<211> 1377 

<212> DNA 

<213> CORONAVIRUS 

<220> 

<221> CDS 

<222> (67).. (133 5) 

<223> 



a^aagg^ca ccaaactgct gcatttagag acgtacttgt tgttttaaat aaacgaacaa 60 

*«-aaa ata tct aat aat gga ccc caa tea aac caa cgt agt gee ccc 108 
attaaa Set Hr Sp SIS Gly Pro Gin Ser Asn Gin Arg ser Ala Pro 



rac ant aca ttt aqt gga ccc aca gat tea act gac aat aac cag aat 
Arg lie Thr Phe SfJ G?y Pro Thr Asp Ser Thr Asp Asn Asn Gin Asn 
15 20 25 *v 

aaa aaa cac aat qqg gca agg cca aaa cag cgc cga ccc caa gat tta 
%fy G?y Arg As"n G?y Ala Arg Pro Lys Gin Arg Arg Pro Gin g| V Leu 



156 



204 



252 



300 



348 



396 



rrr aat aat act acq tct tgg ttc aca get etc act cag cat ggc aag 
Pro III aS Thr All ser Tr P Phe Thr Ala Leu Thr Gin His G.y Lys 
50 55 bU 

g?S 8H 5S SB SS 35 85 SB H5 83 - SJ SS ffi 25 

65 70 /:> 

aqt ggt cca gat gac caa att ggc tac tac cga aga get acc cga cga 
ler Gly Pro Asp Asp Gin lie Gly Tyr Tyr Arg Arg Ala Thr Arg Arg 
80 85 yu 

nrt cat aat aat qac qqc aaa atg aaa gag etc age ccc aga tgg tac 
Sal Arg 85 E5 Hy Lys Me? Lys Glu Leu Ser Pro Arg Trp Tyr 
95 ~* 100 105 AXU 

ttc tat tac eta gga act ggc cca gaa get tea ctt ccc tac ggc get 444 
Phe Tyr Tyr SS GTy Thr GTy Pro Glu Ala ser Leu Pro Tyr fy Ala 
115 J- 20 x 

aac aaa aaa qqc ate qta tgg gtt gca act gag gga gec ttg aat aca 
£n fjl GlS GTy He Val Trp val Ala Thr Glu Gly Ala Leu Asn Thr 
130 135 

ccc aaa aac cac att ggc acc cgc aat cct aat aac aat get gee acc 
Pro 55 ??p His lie GTy Thr Arg Asn Pro Asn Asn Asn Ala Ala Thr 
145 150 15 5 

ata eta caa ctt cct caa gga aca aca ttg cca aaa ggc ttc tac gca 
va? Leu" Gin Leu Pro Gin Gly Thr Thr Leu Pro Lys GTy Phe Tyr Ala 
160 165 I 70 

aaa aaa aqc aga ggc ggc agt caa gec tct tct cgc tec tea tea cgt 
6lu G?y sir Arg GTy 1% sir Gin Ala ser Ser Arg ser ser Ser Arg 
175 180 18 5 • LSU 
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agt cgc ggt aat tea aga aat tea act cct ggc age agt agg gga aat 

Ser Arg Gly Asn Ser Arg Asn Ser Thr Pro Gly ser Ser Arg Gly Asn 

195 200 205 

tct cct get cga atg get age gga ggt ggt gaa act gee etc gcg eta 

ser Pro Ala Arg Met Ala Ser Gly Gly Gly Glu Thr Ala Leu Ala Leu 

210 215 220 



ggc caa caa caa caa ggc caa act gtc act aag aaa tct get get gag 
Gly Gin Gin Gin Gin Gly Gin Thr val Thr Lys Lys Ser Ala Ala Glu 
240 245 250 



684 



732 



ttg ctg eta gac aga ttg aac cag ctt gag age aaa gtt tct ggt aaa 780 
Leu Leu Leu Asp Arg Leu Asn Gin Leu Glu Ser Lys val ser Gly Lys 
225 ~ 230 235 



828 



gca tct aaa aag cct cgc caa aaa cgt act gee aca aaa cag tac aac 876 
Ala ser Lys Lys Pro Arg Gin Lys Arg Thr Ala Thr Lys Gin Tyr Asn 
255 260 265 270 

gtc act caa gca ttt ggg aga cgt ggt cca gaa caa acc caa gga aat 924 
Val Thr Gin Ala Phe Gly Arg Arg Gly Pro Glu Gin Thr Gin Gly Asn 
275 280 285 

ttc ggg gac caa gac eta ate aga caa gga act gat tac aaa cat tgg 972 
Phe Gly Asp Gin Asp Leu lie Arg Gin Gly Thr Asp Tyr Lys His Trp 
290 295 300 

ccg caa att gca caa ttt get cca agt gec tct gca ttc ttt gga atg 1020 
Pro Gin lie Ala Gin Phe Ala Pro Ser Ala Ser Ala Phe Phe Gly Met 
305 310 315 

tea cgc att ggc atg gaa gtc aca cct teg gga aca tgg ctg act tat 1068 
Ser Arg lie Gly Met Glu val Thr Pro Ser Gly Thr Trp Leu Thr Tyr 
320 325 330 

cat gga gee att aaa ttg gat gac aaa gat cca caa ttc aaa gac aac 1116 
His Gly Ala lie Lys Leu Asp Asp Lys Asp Pro Gin Phe Lys Asp Asn 
335 340 345 350 

gtc ata ctg ctg aac aag cac att gac gca tac aaa aca ttc cca cca 1164 
val lie Leu Leu Asn Lys His lie Asp Ala Tyr Lys Thr Phe Pro Pro 
355 360 365 

aca gag cct aaa aag gac aaa aag aaa aag act gat gaa get cag cct 1212 
Thr Glu Pro Lys Lys Asp Lys Lys Lys Lys Thr Asp Glu Ala Gin Pro 
370 375 380 

ttg ccg cag aga caa aag aag cag ccc act gtg act ctt ctt cct gcg 1260 
Leu Pro Gin Arg Gin Lys Lys Gin Pro Thr Val Thr Leu Leu pro Ala 
385 390 395 

get gac atg gat gat ttc tec aga caa ctt caa aat tec atg agt gga 1308 
Ala Asp Met Asp Asp Phe Ser Arg Gin Leu Gin Asn ser Met ser Gly 
400 405 ~ 410 

get tct get gat tea act cag gca taa acactcatga tgaccacaca 1355 
Ala ser Ala Asp ser Thr Gin Ala 
415 420 

aggcagatgg gctatgtaaa eg 1377 

<210> 37 
<211> 422 
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<212> PRT 

<213> CORONAVIRUS 



<400> 37 

Met ser Asp Asn Gly Pro Gin Ser Asn Gin Arg ser Ala Pro Arg lie 
1 5 10 15 

Thr Phe Gly Gly Pro Thr Asp Ser Thr Asp Asn Asn Gin Asn Gly Gly 
20 25 30 

Arg Asn Gly Ala Arg Pro Lys Gin Arg Arg Pro Gin Gly Leu Pro Asn 
35 40 45 

Asn Thr Ala Ser Trp Phe Thr Ala Leu Thr Gin His Gly Lys Glu Glu 
50 55 60 

Leu Arg Phe Pro Arg Gly Gin Gly Val Pro lie Asn Thr Asn ser Gly 
65 " 70 75 80 

Pro Asp Asp Gin lie Gly Tyr Tyr Arg Arg Ala Thr Arg Arg Val Arg 
85 90 95 

Gly Gly Asp Gly Lys Met Lys Glu Leu ser Pro Arg Trp Tyr Phe Tyr 
100 105 110 

Tyr Leu Gly Thr Gly Pro Glu Ala Ser Leu Pro Tyr Gly Ala Asn Lys 

115 120 125 * 

Glu Gly lie Val Trp val Ala Thr Glu Gly Ala Leu Asn Thr Pro Lys 
130 135 140 

Asp His lie Gly Thr Arg Asn Pro Asn Asn Asn Ala Ala Thr Val Leu 
145 150 155 160 

Gin Leu Pro Gin Gly Thr Thr Leu Pro Lys Gly Phe Tyr Ala Glu Gly 
165 170 175 

Ser Arq Gly Gly Ser Gin Ala ser ser Arg Ser Ser Ser Arg Ser Arg 
180 185 ~ 190 

Gly Asn ser Arg Asn Ser Thr pro Gly Ser Ser Arg Gly Asn Ser Pro 
195 200 205 

Ala Arq Met Ala ser Gly Gly Gly Glu Thr Ala Leu Ala Leu Leu Leu 
210 215 220 

Leu Asp Arg Leu Asn Gin Leu Glu Ser Lys val Ser Gly Lys Gly Gin 
225 230 235 240 

Page 65 



1er depot 



S226CA5108.ST25 

Gin Gin Gin Gly Gin Thr val Thr Lys Lys ser Ala Ala Glu Ala ser 
245 250 255 

Lys Lys Pro Arg Gin Lys Arg Thr Ala Thr Lys Gin Tyr Asn Val Thr 
260 265 270 

Gin Ala Phe Gly Arg Arg Gly Pro Glu Gin Thr Gin Gly Asn Phe Gly 
275 280 285 

Asp Gin Asp Leu lie Arg Gin Gly Thr Asp Tyr Lys His Trp Pro Gin 
290 295 300 

lie Ala Gin Phe Ala Pro Ser Ala Ser Ala Phe Phe Gly Met Ser Arg 
305 310 315 320 

lie Gly Met Glu val Thr Pro Ser Gly Thr Trp Leu Thr Tyr His Gly 
325 330 335 

Ala lie Lys Leu Asp Asp Lys Asp Pro Gin Phe Lys Asp Asn Val lie 
340 345 350 

Leu Leu Asn Lys His lie Asp Ala Tyr Lys Thr Phe Pro Pro Thr Glu 
355 360 365 

Pro Lys Lys Asp Lys Lys Lys Lys Thr Asp Glu Ala Gin Pro Leu Pro 
370 375 380 

Gin Arg Gin Lys Lys Gin Pro Thr Val Thr Leu Leu Pro Ala Ala Asp 
385 390 395 400 

Met Asp Asp Phe Ser Arg Gin Leu Gin Asn Ser Met Ser Gly Ala ser 
405 410 415 

Ala Asp ser Thr Gin Ala 
420 

<210> 38 
<211> 1377 
<212> DNA 
<213> CORONAVIRUS 



<400> 38 

atgaaggtca ccaaactgct gcatttagag acgtacttgt tgttttaaat aaacgaacaa 60 

attaaaatgt ctgataatgg accccaatca aaccaacgta gtgccccccg cattacattt 120 

ggtggaccca cagattcaac tgacaataac cagaatggag gacgcaatgg ggcaaggcca 180 

aaacagcgcc gaccccaagg tttacccaat aatactgcgt cttggttcac agctctcact 240 

cagcatggca aggaggaact tagattccct cgaggccagg gcgttccaat caacaccaat 300 
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* 


agtggtccag 


atgaccaaat 


tggctactac cgaagagcta 


cccgacgagt 


tcgtggtggt 


360 


gacggcaaaa 


tgaaagagct 


cagccccaga tggtacttct 


attacctagg 


aactggccca 


420 


gaagcttcac 


ttccctacgg 


cgctaacaaa gaaggcatcg 


tatgggttgc 


aactgaggga 


480 


gccttgaata 


cacccaaaga 


ccacattggc 


acccgcaatc 


ctaataacaa 


tgctgccacc 


540 


gtgctacaac 


ttcctcaagg 


aacaacattg 


ccaaaaggct 


tctacgcaga 


gggaagcaga 


600 


ggcggcagtc 


aagcctcttc 


tcgctcctca tcacgtagtc 


gcggtaattc 


aagaaattca 


660 


actcctggca 


gcagtagggg 


aaattctcct 


gctcgaatgg 


ctagcggagg 


tggtgaaact 


720 


gccctcgcgc 


tattgctgct 


agacagattg 


aaccagcttg 


agagcaaagt 


ttctggtaaa 


780 


ggccaacaac 


aacaaggcca 


aactgtcact 


aagaaatctg 


ctgctgaggc 


atctaaaaag 


840 


cctcgccaaa 


aacgtactgc 


cacaaaacag 


tacaacgtca 


ctcaagcatt 


tgggagacgt 


900 


ggtccagaac 


aaacccaagg 


aaatttcggg 


gaccaagacc 


taatcagaca 


aggaactgat 


960 


tacaaacatt 


ggccgcaaat 


tgcacaattt 


gctccaagtg 


cctctgcatt 


ctttggaatg 


1020 


tcacgcattg 


gcat:ggaagt 


cacaccttcg 


ggaacatggc 


tgacttatca 


tggagccatt 


1080 


aaattggatg 


acaaagatcc 


acaattcaaa 


gacaacgtca 


tactgctgaa 


caagcacatt 


1140 


gacgcataca 


aaacattccc 


accaacagag 


cctaaaaagg 


acaaaaagaa 


aaagactgat 


1200 


gaagctcagc 


ctttgccgca 


gagacaaaag 


aagcagccca 


ctgtgactct 


tcttcctgcg 


1260 


gctgacatgg 


atgatttctc 


cagacaactt 


caaaattcca 


tgagtggagc 


ttctgctgat 


1320 


tcaactcagg 


cataaacact 


catgatgacc 


acacaaggca 


gatgggctat 


gtaaacg 


1377 



<210> 39 

<211> 204 

<212> DNA 

<213> CORONA VIRUS 

<400> 39 

atattaggtt tttacctacc caggaaaagc caaccaacct cgatctcttg tagatctgtt 60 

ctctaaacga actttaaaat ctgtgtagct gtcgctcggc tgcatgccta gtgcacctac 120 

gcagtataaa caataataaa ttttactgtc gttgacaaga aacgagtaac tcgtccctct 180 

tctgcagact gcttacggtt tcgt 204 

<210> 40 

<211> 809 

<212> DNA 

<213> CORONAVIRUS 
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<400> 40 

actcaagcat ttgggagacg tggtccagaa caaacccaag gaaatttcgg ggaccaagac 60 

ctaatcagac aaggaactga ttacaaacat tggccgcaaa ttgcacaatt tgctccaagt 120 

gcctctgcat tctttggaat gtcacgcatt ggcatggaag tcacaccttc gggaacatgg 180 

ctgacttatc atggagccat taaattggat gacaaagatc cacaattcaa agacaacgtc 240 

atactgctga acaagcacat tgacgcatac aaaacattcc caccaacaga gcctaaaaag 300 

gacaaaaaga aaaagactga tgaagctcag cctttgccgc agagacaaaa gaagcagccc 360 

actgtgactc ttcttcctgc ggctgacatg gatgatttct ccagacaact tcaaaattcc 420 

atgagtggag cttctgctga ttcaactcag gcataaacac tcatgatgac cacacaaggc 480 

agatgggcta tgtaaacgtt ttcgcaattc cgtttacgat acatagtcta ctcttgtgca 540 

gaatgaattc tcgtaactaa acagcacaag taggtttagt taactttaat ctcacatagc 600 

aatctttaat caatgtgtaa cattagggag gacttgaaag agccaccaca ttttcatcga 660 

ggccacgcgg agtacgatcg agggtacagt gaataatgct agggagagct gcctatatgg 720 

aagagcccta atgtgtaaaa ttaattttag tagtgctatc cccatgtgat tttaatagct 780 

tcttaggaga atgacaaaaa aaaaaaaaa 809 

<210> 41 

<211> 448 

<212> DNA 

<213> CORONAVIRUS 



<400> 41 

aatgaacaca tagggctgtt caagctgggg cagtacgcct ttttccagct ctactagacc 60 

acaagtgcca tttttgaggt gttcacgtgc ctccgatagg gcctcttcca cagagtcccc 120 

gaagccacgc acnagcacgt ctctaacctg aaggacaggc aaactgagtt ggacgtgtgt 180 

tttctcgttg acaccaagaa caaggctctc catcttacct ttcggtcaca cccggacgaa 240 

acctaggtat gctgatgatc gactgcaaca cggacgaaac cgtaagcagt ctgcagaaga 300 

gggacgagtt actcgtttct tgtcaacgac agtaaaattt attattgttt atactgcgta 360 

ggtgcactag gcatgcagcc gagcgacagc tacacagatt ttaaagttcg tttagagaac 420 

agatctacaa gagatcgagg ttggttgg 448 

<210> 42 

<211> 2033 

<212> DNA 

<213> CORONAVIRUS 
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<400> 42 «n-n-n nananrrttfl T/tCttOatat 60 



aS2ctaggt ttcgtccggg tgtgaccgaa aggtaagatg gagagccttg ttcttggtgt 

caacgagaaa acacacgtcc aactcagttt gcctgtcctt caggttagag acgtgctagt 

gcgtggcttc ggggactctg tggaagaggc cctatcggag gcacgtgaac acctcaaaaa 

tggcacttgt ggtctagtag agctggaaaa aggcgtactg ccccagcttg aacagcccta 

tgtgttcatt aaacgttctg atgccttaag caccaatcac ggccacaagg tcgttgagct 

ggttgcagaa atggacggca ttcagtacgg tcgtagcggt ataacactgg gagtactcgt 

gccacatgtg ggcgaaaccc caattgcata ccgcaatgtt cttcttcgta agaacggtaa 

taagggagcc ggtggtcata gctatggcat cgatctaaag tcttatgact taggtgacga 

gcttggcact gatcccattg aagattatga acaaaactgg aacactaagc atggcagtgg 

tgcactccgt gaactcactc gtgagctcaa tggaggtgca gtcactcgct atgtcgacaa 

caatttctgt ggcccagatg ggtaccctct tgattgcatc aaagattttc tcgcacgcgc 

gggcaagtca atgtgcactc tttccgaaca acttgattac atcgagtcga agagaggtgt 

ctactgctgc cgtgaccatg agcatgaaat tgcctggttc actgagcgct ctgataagag 

ctacgagcac cagacaccct tcgaaattaa gagtgccaag aaatttgaca ctttcaaagg 

ggaatgccca aagtttgtgt ttcctcttaa ctcaaaagtc aaagtcattc aaccacgtgt 

tgaaaagaaa aagactgagg gtttcatggg gcgtatacgc tctgtgtacc ctgttgcatc 

tccacaggag tgtaacaata tgcacttgtc taccttgatg aaatgtaatc attgcgatga 

agtttcatgg cagacgtgcg actttctgaa agccacttgt gaacattgtg gcactgaaaa 

tttagttatt gaaggaccta ctacatgtgg gtacctacct actaatgctg tagtgaaaat 

gccatgtcct gcctgtcaag acccagagat tggacctgag catagtgttg cagattatca 

caaccactca aacattgaaa ctcgactccg caagggaggt aggactagat gttttggagg 

ctgtgtgttt gcctatgttg gctgctataa taagcgtgcc tactgggttc ctcgtgctag 

tgctgatatt ggctcaggcc atactggcat tactggtgac aatgtggaga ccttgaatga 

ggatctcctt gagatactga gtcgtgaacg tgttaacatt aacattgttg gcgattttca 

tttgaatgaa gaggttgcca tcattttggc atctttctct gcntctacaa gtgcctttat 

tgacactata aagagtcttg attacaagtc tttcaaaacc attgttgagt cctgcggtaa 

ctataaagtt accaagggaa agcccgtaaa aggtgcttgg aacattggac aacagagatc 

agttttaaca ccactgtgtg gttttccctc acaggctgct ggtgttatca gatcaatttt 

tgcgcgcaca cttgatgcag caaaccactc aattcctgat ttgcaaagag cagctgtcac 

catacttgat ggtatttctg aacagtcatt acgtcttgtc gacgccatgg tttatacttc 

agacctgctc accaacagtg tcattattat ggcatatgta actggtggtc ttgtacaaca 

gacttctcag tggttgtcta atcttttggg cactactgtt gaaaaactca ggcctatctt 

tgaatggatt gaggcgaaac ttagtgcagg agttgaattt ctcaaggatg cttgggagat 

tctcaaattt ctcattacag gtgtttttga catcgtcaag ggtcaaatac agg 
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120 
180 
240 
300 
360 
420 
480 
540 
600 
660 
720 
780 
840 
900 
960 
1020 
1080 
1140 
1200 
1260 
1320 
1380 
1440 
1500 
1560 
1620 
1680 
1740 
1800 
1860 
1920 
1980 
2033 
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<210> 43 

<211> 2018 

<212> DNA 

<213> CORONAVIRUS 

<400> 43 

ggattgaggc gaaacttagt gcaggagttg aatttctcaa ggatgcttgg gagattctca 60 

aatttctcat tacaggtgtt tttgacatcg tcaagggtca aatacaggtt gcttcagata 120 

acatcaagga ttgtgtaaaa tgcttcattg atgttgttaa caaggcactc gaaatgtgca 180 

ttgatcaagt cactatcgct ggcgcaaagt tgcgatcact caacttaggt gaagtcttca 240 

tcgctcaaag caagggactt taccgtcagt gtatacgtgg caaggagcag ctgcaactac 300 

tcatgcctct taaggcacca aaagaagtaa cctttcttga aggtgattca catgacacag 360 

tacttacctc tgaggaggtt gttetcaaga acggtgaact cgaagcactc gagacgcccg 420 

ttgatagctt cacaaatgga gctatcgttg gcacaccagt ctgtgtaaat ggcctcatgc 480 

tcttagagat taaggacaaa gaacaatact gcgcattgtc tcctggttta ctggctacaa 540 

acaatgtctt tcgcttaaaa gggggtgcac caattaaagg tgtaaccttt ggagaagata 600 

ctgtttggga agttcaaggt tacaagaatg tgagaatcac atttgagctt gatgaacgtg 660 

ttgacaaagt gcttaatgaa aagtgctctg tctacactgt tgaatccggt accgaagtta 720 

ctgagtttgc atgtgttgta gcagaggctg ttgtgaagac tttacaacca gtttctgatc 780 

tccttaccaa catgggtatt gatcttgatg agtggagtgt agctacattc tacttatttg 840 

atgatgctgg tgaagaaaac ttttcatcac gtatgtattg ttccttttac cctccagatg 900 

aggaagaaga ggacgatgca gagtgtgagg aagaagaaat tgatgaaacc tgtgaacatg 960 

agtacggtac agaggatgat tatcaaggtc tccctctgga atttggtgcc tcagctgaaa 1020 

cagttcgagt tgaggaagaa gaagaggaag actggctgga tgatactact gagcaatcag 1080 

agattgagcc agaaccagaa cctacacctg aagaaccagt taatcagttt actggttatt 1140 

taaaacttac tgacaatgtt gccattaaat gtgttgacat cgttaaggag gcacaaagtg 1200 

ctaatcctat ggtgattgta aatgctgcta acatacacct gaaacatggt ggtggtgtag 1260 

caggtgcact caacaaggca accaatggtg ccatgcaaaa ggagagtgat gattacatta 1320 

agctaaatgg ccctcttaca gtaggagggt cttgtttgct ttctggacat aatcttgcta 1380 

agaagtgtct gcatgttgtt ggacctaacc taaatgcagg tgaggacatc cagcttctta 1440 

aggcagcata tgaaaatttc aattcacagg acatcttact tgcaccattg ttgtcagcag 1500 

gcatatttgg tgctaaacca cttcagtctt tacaagtgtg cgtgcagacg gttcgtacac 1560 

aggtttatat tgcagtcaat gacaaagctc tttatgagca ggttgtcatg gattatcttg 1620 

ataacctgaa gcctagagtg gaagcaccta aacaagagga gccaccaaac acagaagatt 1680 

Page 70 



.W. w - 



S226CA5108.ST25 

ccaaaactga ggagaaatct gtcgtacaga agcctgtcga tgtgaagcca aaaattaagg 
cctgcattga tgaggttacc acaacactgg aagaaactaa gtttcttacc aataagttac 
tcttgtttgc tgatatcaat ggtaagcttt accatgattc tcagaacatg cttagaggtg 
aagatatgtc tttccttgag aaggatgcac cttacatggt aggtgatgtt atcactagtg 
gtgatatcac ttgtgttgta ataccctcca aaaaggctgg tggcactact gagatgctct 
caagagcttt gaagaaagtg ccagttgatg agtatata 

<210> 44 

<211> 1442 

<212> DNA 

<213> CORONAVIRUS 



1740 
1800 
1860 
1920 
1980 
2018 



<400> 44 
ttgatgaggt 

ttgctgatat 

tgtctttcct 

tcacttgtgt 

ctttgaagaa 

gttatacact 

taccttcaga 

gagaaatgct 

gagccataat 

ttgactatgg 

cgaagctgaa 

gttttaatct 

cagtatcatc 

catctgagga 

attcaggaca 

accacactct 

aactaaagag 

acaacactaa 

gtccaacata 

gtaagacttt 

accatactct 

aatggaaatt 



taccacaaca 
caatggtaag 
tgagaaggat 
tgtaataccc 
agtgccagtt 
tgaggaagct 
agcacctaat 
tgctcatgct 
ggcaaccatc 
ngtccgattc 
ctctctaaat: 
tgaagaggct 
accagatgct 
gcactttgta 
gcgtacagag 
ggagagcccc 
tctcttatcc 
tctccacaca 
cttggatggt 
ctttgtacta 
tgatgagagt 
trcctcaagtt 



ctggaagaaa 

ctttaccatg 

gcaccttaca 

tccaaaaagg 

gatgagtata 

aagactgctc 

gctaaggaag 

gaagagacaa 

caacgtaagt 

ttcttttata 

gagccgcttg 

gcgcgctgta 

gttactacat 

gaaacagttt 

ttaggtgttg 

gtcgagtttc 

ctgcgggagg 

cagcttgtgg 

gctgatgtta 

cctagtgatg 

tttcttggta 

ggtggtttaa 



ctaagtttct taccaataag 

attctcagaa catgcttaga 

tggtaggtga tgttatcact 

ctggtggcac tactgagatg 

taaccacgta ccctggacaa 

ttaagaaatg caaatctgca 

agattctagg aactgnatcc 

gaaaattaat gcctatatgc 

ataaaggaat taaaattcaa 

ctagtaaaga gcctgtagct 

tcacaatgcc aattggttat 

tgcgttctct taaagctcct 

ataatggata cctcacttcg 

ctttggctgg ctcttacaga 

aatttcttaa gcgtggtgac 

atcttgacgg tgaggttctt 

ttaagactat aaaagtgttc 

atatgtctat gacatatgga 

caaaaattaa acctcatgta 

acacactacg tagtgaagct 

ggtacatgtc tgctttaaac 

cttcaattaa atgggctgat 
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ttactcttgt 

ggtgaagata 

agtggtgata 

ctctcaagag 

ggatgtgctg 

ttttatgtac 

tggaatttga 

atggatgtta 

gagggcatcg 

tctattatta 

gtgacacatg 

gccgtagtgt 

tcatcaaaga 

gattggtcct 

aaaattgtgt 

tcacttgaca 

acaactgtgg 

cagcagtttg 

aatcatgagg 

ttcgagtact 

cacacaaaga 

aacaattgtt 



bO 








-1 OA 




240 


r 


300 




360 




420 




480 




540 




600 




660 




720 




780 




840 




900 




960 




1020 




1080 




1140 




1200 




1260 




1320 
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atttgtctag 


tgttttatta 




aacttoaaot: caaattcaat 


gcaccagcac 


1380 


ttcaagaggc 


ttattataga 


gcccgtgctg 


gtgatgctgc taacttttgt 


gcactcatac 


1440 


tc 










1442 


<210> 45 












<211> 1050 










<212> DNA 












<213> CORONAVIRUS 










<400> 45 
atatgtctat 


gacatatgga 


cagcagtttg 


gtccaacata cttggatggt 


gctgatgtta 


60 


caaaaattaa 


acctcatgta 


aatcatgagg 


gtaagacttt ctttgtacta 


cctagtgatg 


120 


acacactacg 


tagtgaagct 


ttcgagtact 


accatactct tgatgagagt 


tttcttggta 


180 


ggtacatgtc 


tgctttaaac 


cacacaaaga 


aatggaaatt tcctcaagtt 


ggtggtttaa 


240 


cttcaattaa 


atgggctgat 


aacaattgtt 


atttgtctag tgttttatta 


gcacttcaac 


300 


agcttgaagt 


caaattcaat 


gcaccagcac 


ttcaagaggc ttattataga 


gcccgtgctg 


360 


gtgatgctgc 


taacttttgt 


gcactcatac 


tcgcttacag taataaaact 


gttggcgagc 


420 


ttggtgatgt 


cagagaaact 


atgacccatc 


ttctacagca tgctaatttg 


gaatctgcaa 


480 


agcgagttct 


taatgtggtg 


tgtaaacatt 


gtggtcagaa aactactacc 


ttaacgggtg 


540 


tagaagctgt 


gatgtatatg 


ggtactctat 


cttatgataa tcttaagaca 


ggtgtttcca 


600 


ttccatgtgt 


gtgtggtcgt 


gatgctacac 


aatatctagt acaacaagag 


tcttcttttg 


660 


ttatgatgtc 


tgcaccacct 


gctgagtata 


aattacagca aggtacattc 


ttatgtgcga 


720 


atgagtacac 


tggtaactat 


cagtgtggtc 


attacactca tataactgct 


aaggagaccc 


780 


tctatcgtat 


tgacggagct 


caccttacaa 


agatgtcaga gtacaaagga 


ccagxgaci.g 


OHU 


atgttttcta 


caaggaaaca 


tcttacacta 


caaccatcaa gcccgLgrcg 


~> *~ +- r~ r\ 

xaxaaacxcg 




atggagttac 


ttacacagag 


attgaaccaa 


aattggai.gg gianaiaaa 






cttactatac 


agagcagcct 


atagaccttg 


taccaactca accattacca 


aatgcgagtt 


1020 


ttgataattt 


caaactcaca 


tgttctaaca 






1050 


<210> 46 












<211> 1995 










<212> DNA 












<213> CORONAVIRUS 










<400> 46 
tttgtgcact 


catactcgct 


tacagtaata 


aaactgttgg cgagcttggt 
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gatgtcagag 


60 



aaactatgac 
tggtgtgtaa 
atatgggtac 
gtcgtgatgc 
cacctgctga 
actatcagtg 
gagctcacct 
aaacatctta 
cagagattga 
agcctataga 
tcacatgttc 
cagcttcacg 
ttgactatag 
ttgtttggca 
tacgttgtct 
tagaagacac 
aagtagtgga 
aagttgtagg 
taggtcatga 
ctaatgagct 
ttaatagtgt 
caattacaac 
cttatgtgtt 
ttagagcttc 
gtttggatgc 
ctatgtggct 
ttggtgtact 
atcttaattc 
tttgtttaag 
cgatttcatc 
catatatgtt 
tctttggcta 
gtattgtaca 



ccatcttcta 
acattgtggt 
tctatcttat 
tacacaatat 
gtataaatta 
tggtcattac 
tacaaagatg 
cactacaacc 
accaaaattg 
ccttgtacca 
taacacaaaa 
agagctatct 
acactattca 
cattaaccag 
ttggagtaca 
acaaggaatg 
aaatcctacc 
caatgtcata 
ggatcttatg 
ttcactagcc 
tccttggagt 
atcaaattgc 
tacattattg 
actacctaca 
cggcattaat 
attgttgtta 
cttatctaat 
gtctaacgtt 
tggattagac 
gtacaagcta 
gttcacaaaa 
ttttgctagt 
aatgg 



cagcatgcta 
cagaaaacta 
gataatctta 
ctagtacaac 
cagcaaggta 
actcatataa 
tcagagtaca 
atcaagcctg 
gatgggtatt 
actcaaccat 
tttgctgatg 
gtcacattct 
gcgagtttca 
gctacaacca 
aagccagtag 
gacaatcttg 
atacagaagg 
cttaaaccat 
gctgcttatg 
ttaggtttaa 
aaaattttgg 
gctaagagat 
ttccaattgt 
actattgcta 
tatgtgaagt 
agtatttgct 
tttggtgctc 
actactatgg 
tcccttgatt 
gacttgacaa 
ttcttttatt 
catttcatca 



S226CAS108. 
atttggaatc 
ctaccttaac 
agacaggtgt 
aagagtcttc 
cattcttatg 
ctgctaagga 
aaggaccagt 
tgtcgtataa 
ataaaaagga 
taccaaatgc 
atttaaatca 
tcccagactt 
agaaaggtgc 
agacaacgtt 
atacttcaaa 
cttgtgaaag 
aagtcataga 
cagatgaagg 
tggaaaacac 
aaacaattgc 
cttatgtcaa 
tagcacaacg 
gtacttttac 
aaaatagtgt 
cacccaaatt 
taggttctct 
cttcttattg 
atttctgtga 
cttatccagc 
ttttaggtct 
tattaggtct 
gcaattcttg 



ST25 

tgcaaagcga 
gggtgtagaa 
ttccattcca 
ttttgttatg 
tgcgaatgag 
gaccctctat 
gactgatgtt 
actcgatgga 
taatgcttac 
gagttttgat 
aatgacaggc 
gaatggcgat 
taaattactg 
caaaccaaac 
ttcatttgaa 
tcaacaaccc 
gtgtgacgtg 
tgttaaagta 
aagcattacc 
cactcatggt 
accattctta 
tgtgtttaac 
taaaagtacc 
taagagtgtt 
ttctaaattg 
aanctgtgta 
taatggcgtt 
aggttctttt 
tcttgaaacc 
ggccgctgag 
ttcagctata 
gctcatgtgg 



gttcttaatg 120 

gctgtgatgt 180 

tgtgtgtgtg 240 

atgtctgcac 300 

tacactggta 360 

cgtattgacg 420 

ttctacaagg 480 

gttacttaca 540 

tatacagagc 600 

aatttcaaac 660 

ttcacaaagc 720 

gtagtggcta 780 

cataagccaa 840 

acttggtgtt 900 

gttctggcag 960 

acctctgaag 1020 

aaaactaccg 1080 

acacaagagt 1140 

attaagaaac 1200 

attgctgcaa 1260 

ggacaagcag 1320 

aattatatgc 1380 

aattctagaa 1440 

gctaaattat 1500 

ttcacaatcg 1560 

actgctgctt 1620 

agagaattgt 1680 

ccttgcagca 1740 

attcaggtga 1800 

tgggttttgg 1860 

atgcaggtgt 1920 

tttatcatta 1980 
1995 
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S226CAS108.ST25 

<210> 47 
<211> 1884 
<212> DNA 
<213> CORONAVIRUS 



<400> 47 
aattcttggc 


tcatgtggtt 


tatcattagt 


attgtacaaa 


tggcacccgt 


ttctgcaatg 


60 


gttaggatgt 


acatcttctt 


tgcttctttc 


tactacatat 


ggaagagcta 


tgttcatatc 


120 


atggatggtt 


gcacctcttc 


gacttgcatg 


atgtgctata 


agcgcaatcg 


tgccacacgc 


180 


gttgagtgta 


caactattgt 


taatggcatg 


aagagatctt 


tctatgtcta 


tgcaaatgga 


240 


ggccgtggct 


tctgcaagac 


tcacaattgg 


aattgtctca 


attgtgacac 


attttgcact 


300 


ggtagtacat 


tcattagtga 


tgaagttgct 


cgtgatttgt 


cactccagtt 


taaaagacca 


360 


atcaacccta 


ctgaccagtc 


atcgtatatt 


gttgatagtg 


ttgctgtgaa 


aaatggcgcg 


420 


cttcacctct 


actttgacaa 


ggctggtcaa aagacctatg 


agagacatcc 


gctctcccat 


480 


tttgtcaatt 


tagacaattt 


gagagctaac aacactaaag 


gttcactgcc 


tattaatgtc 


540 


atagtttttg 


atggcaagtc 


caaatgcgac 


gagtctgctt 


ctaagtctgc 


ttctgtgtac 


600 


tacagtcagc 


tgatgtgcca 


acctattctg 


ttgcttgacc 


aagctcttgt 


atcagacgtt 


660 


ggagatagta 


ctgaagtttc 


cgttaagatg tttgatgctt 


atgtcgacac 


cttttcagca 


720 


acttttagtg 


ttcctatgga 


aaaacttaag 


gcacttgttg 


ctacagctca 


cagcgagtta 


780 


gcaaagggtg 


tagctttaga 


tggtgtcctt tctacattcg 


tgtcagctgc 


ccgacaaggt 


840 


gttgttgata 


ccgatgttga 


cacaaaggat 


gttattgaat 


gtctcaaact 


ttcacatcac 


900 


tctgacttag 


aagtgacagg 


tgacagttgt aacaatttca 


tgctcaccta taataaggtt 


960 


gaaaacatga 


cgcccagaga 


tcttggcgca tgtattgact 


gtaatgcaag 


gcatatcaat 


1020 


gcccaagtag 


caaaaagtca 


caatgtttca 


ctcatctgga 


atgtaaaaga ctacatgtct 


1080 


ttatctgaac 


agctgcgtaa 


acaaattcgt 


agtgctgcca 


agaagaacaa 


catacctttt 


1140 


agactaactt 


gtgctacaac 


tagacaggtt 


gtcaatgtca 


taactactaa 


aatctcactc 


1200 


aagggtggta 


agattgttag 


tacttgtttt aaacttatgc 


ttaaggccac attattgtgc 


1260 


gttcttgctg 


cattggtttg 


ttatatcgtt 


atgccagtac 


atacattgtc 


aatccatgat 


1320 


ggttacacaa 


atgaaatcat 


tggttacaaa 


gccattcagg 


atggtgtcac 


tcgtgacatc 


1380 


atttctactg 


atgattgttt 


tgcaaataaa 


catgctggtt 


ttgacgcatg 


gtttagccag 


1440 


cgtggtggtt 


catacaaaaa 


tgacaaaagc 


tgccctgtag 


tagctgctat 


cattacaaga 


1500 


gagattggtt 


tcatagtgcc 


tggcttaccg 


ggtactgtgc 


tgagagcaat 


caatggtgac 


1560 


ttcttgcatt 


ttctacctcg 


tgtttttagt 


gctgttggca 


acatttgcta 


cacaccttcc 


1620 


aaactcattg 


agtatagtga 


ttttgctacc 


tctgcttgcg 


ttcttgctgc 


tgagtgtaca 


1680 


atttttaagg 


atgctatggg 


caaacctgtg 


ccatattgtt 
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atgacactaa tttgctagag 


1740 



S226CAS108.ST25 

ggttctattt cttatagtga gcttcgtcca gacactcgtt atgtgcttat ggatggttcc 1800 
atcatacagt ttcctaacac ttacctggag ggttctgtta gagtagtaac aacttttgat I860 

1884 

gctgagtact gtagacatgg taca 

<210> 48 

<211> 2020 

<212> DNA 

<213> CORQNAVIRUS 



60 
120 
180 
240 
300 
360 
420 
480 



«c?cgtKt gtgcttatgg atggttccat catacagttt cctaacactt acctggaggg 

ttctgttaga gtagtaacaa cttttgatgc tgagtactgt agacatggta catgcgaaag 

gtcagaagta ggtatttgcc tatctaccag tggtagatgg gttcttaata atgagcatta 

cagagctcta tcaggagttt tctgtggtgt tgatgcgatg aatctcatag ctaacatctt 

tactcctctt gtgcaacctg tgggtgcttt agatgtgtct gcttcagtag tggctggtgg 

tattattgcc atattggtga cttgtgctgc ctactacttt atgaaattca gacgtgtttt 

tggtgagtac aaccatgttg ttgctgctaa tgcacttttg tttttgatgt ctttcactat 

actctgtctg gtaccagctt acagctttct gccgggagtc tactcagtct tttacttgta 

cttgacattc tatttcacca atgatgtttc attcttggct caccttcaat ggtttgccat 540 

gttttctcct attgtgcctt tttggataac agcaatctat gtattctgta tttctctgaa 600 ^ 

gcactgccat tggttcttta acaactatct taggaaaaga gtcatgttta atggagttac 

atttagtacc ttcgaggagg ctgctttgtg tacctttttg ctcaacaagg aaatgtacct 

aaaattgcgt agcgagacac tgttgccact tacacagtat aacaggtatc ttgctctata 

taacaagtac aagtatttca gtggagcctt agatactacc agctatcgtg aagcagcttg 

ctgccactta gcaaaggctc taaatgactt tagcaactca ggtgctgatg ttctctacca 

accaccacag acatcaatca cttctgctgt tctgcagagt ggttttagga aaatggcatt 

cccgtcaggc aaagttgaag ggtgcatggt acaagtaacc tgtggaacta caactcttaa 

tggattgtgg ttggatgaca cagtatactg tccaagacat gtcatttgca cagcagaaga 

catgcttaat cctaactatg aagatctgct cattcgcaaa tccaaccata gctttcttgt 

tcaggctggc aatgttcaac ttcgtgttat tggccattct atgcaaaatt gtctgcttag 

gcttaaagtt gatacttcta accctaagac acccaagtat aaatttgtcc gtatccaacc 

tggtcaaaca ttttcagttc tagcatgcta caatggttca ccatctggtg tttatcagtg 

tgccatgaga cctaatcata ccattaaagg ttctttcctt aatggatcat gtggtagtgt 

tggttttaac attgattatg attgcgtgtc tttctgctat atgcatcata tggagcttcc 

aacaggagta cacgctggta ctgacttaga aggtaaattc tatggtccat ttgttgacag 
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660 
720 
780 
840 
900 
960 
1020 
1080 
1140 
1200 
1260 
1320 
1380 
1440 
1500 



1er depdt 



S226CAS108.ST25 

acaaactgca caggctgcag gtacagacac aaccataaca ttaaatgttt tggcatggct 1560 

gtatgctgct gttatcaatg gtgataggtg gtttcttaat agattcacca ctactttgaa 1620 

tgactttaac cttgtggcaa tgaagtacaa ctatgaacct ttgacacaag atcatgttga 1680 

catattggga cctctttctg ctcaaacagg aattgccgtc ttagatatgt gtgctgcttt 1740 

gaaagagctg ctgcagaatg gtatgaatgg tcgtactatc cttggtagca ctattttaga 1800 

agatgagttt acaccatttg atgttgttag acaatgctct ggtgttacct tccaaggtaa 1860 

gttcaagaaa attgttaagg gcactcatca ttggatgctt ttaactttct tgacatcact 1920 

attgattctt gttcaaagta cacagtggtc actgtttttc tttgtttacg agaatgcttt 1980 

cttgccattt actcttggta ttatggcaat tgctgcatgt 2020 

<210> 49 

<211> 2040 

<212> DNA 

<213> CORONAVIRUS 

<400> 49 

agcatttcca gcctgaagac gtactgtagc agctaaactg cccagcacca tacctctatt 60 

taggttgttt aagcctttga tgaagtacaa gtatttcact ttaggccctt ttggtgtgtc 120 

tgtaacaaac ctacaaggtg gttccagttc tgtgtaaatt gtacctgtac catcactctt 180 

agggaatcta gcccatttga gatcttggtg gtctgatagt aatgccagca caaacctacc 240 

tcccttcgaa ttgttatagt aggcaagtgc attgtcatca gtacaagctg tttgtgtggt 300 

accagccgca caggacatct gtcgtagtgc tactggactc agttcattat tctgtagttt 360 

aacagctgag ttggctctta gagctgtaac aataagaggc caagccaaat ttggtgaatt 420 

gtccatgtta atttcactaa gttgaacaat cttgctatcc gcatcaacaa cttgctggat 480 

ttcccagagt gcagatgcat atgtaaaggt gttaccatca caagtgttct tgtaggtacc 540 

ataatcaggg acaacaacca tgagtttggc tgctgtagtc aatggtatga tgttgagtgg 600 

aacacaacca tcacgcgcat tgttgataat gttgttaagt gcatcattat caagcttcct 660 

aagcatagtg aagagcattg tttgcatagc actagttact tttgccctct tgtcctcaga 720 

tcttgcctgt ttgtacattt gggtcatagc etgatctgcc atcttttcca acttgcgttg 780 

catggcagca tcacggtcaa actcagattt agccacattc aaagatttct ttaacttttt 840 

gagaacgact tcagaatcac cattagctac agcctgctca taggcctcct gggcagtggc 900 

ataagcggca tatgatggta aagaactaaa ttctgaagca atagcctgaa gagtagcacg 960 

gttatcgagc atttcctcgc acaacctatt aatgtctaca gcaccctgca tggatagcaa 1020 

aacagacaaa agagaaacca tcttctcgaa agcttcagtt gtgtcttttg caagaagaat 1080 

atcattgtgg agttgtacac attgtgccca caatttagaa gatgactcta ctctaagttg 1140 
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ttgaagaacc 
agtagcaacc 
agcatcaata 
tgtagagacc 
gaaaaggcca 
ctgtaaggtg 
agctctagct 
aactaaggcc 
aagtgtaatg 
agctgtcatg 
ataaccagac 
agcaggcatg 
gcacaagaat 
accaagagta 
actttgaaca 



gagagcagta 
ttgatacatg 
ctactcttag 
aagtagtcat 
aagtagcagc 
ttgccagtaa 
aaaaacatga 
cacatggaaa 
acattcatca 
agaataagca 
aagctagtgt 
tagaccatat 
gcgtgcttat 
aatggcaaga 
agaatcaata 



ccacagatgt 
gtttacctcc 
gaggcaaaag 
aaacaccaag 
agcaacaata 
taaataacaa 
tagtcgtaac 
tagcttgatc 
gtgtccaaac 
aaactaaagc 
cagccaattc 
taaagtaagc 
gcttaacaag 
aagcattctc 
gtgatgtcaa 



S226CAS108. 
gcactttacg 
aatacccaac 
cccctgggag 
agtaagcctg 
gcctaagaaa 
tgggtaatac 
gacaccagaa 
taaagcatta 
acgtctagca 
tgaagcatac 
aagccatgtc 
aactgttgca 
cagcatagca 
gtaaacaaag 
gaaagtuaaa 



ST25 

tcagacattt 

aacttaatgt 

ttcatatacc 

aagtaacggt 

caataaacaa 

tcaacacaca 

tagttagagg 

ccatagtaga 

gcatcatcat 

ataacacaat 

atgatacgca 

agagaaggta 

catgcagcaa 

aaaaacagtg 

agcatccaat 



tagactg-tac 

taagcttgaa 

taaattcttg 

tgagtaaaca 

gcatgataca 

caaacactat 

ttacagaaat 

ctttgtaaac 

aaacagtgcg 

ccttaagcct 

tcacccagct 

acagaaacaa 

ttgccataat 

accactgtgt 

gatgagtgca 



1200 

1260 

1320 

1380 

1440 

1500 

1560 

1620 

1680 

1740 

1800 

1860 

1920 

1980 

2040 



<210> 50 

<211> 2012 

<212> DNA 

<213> CORONAVIRUS 



<400> 50 
cttgtaggtt 

aaggcttaaa 

ttcaggctgg 

ttgcagtaga 

ccaactgtgt 

cagaagctaa 

gccacattga 

tacctaccac 

tctgcggaat 

agtctgcgga 

accgtgcggc 

aaaagttgct 

tgaggaaggc 



tgttacagac 
caacctaaat 
aaatgctaca 
ccctgctaaa 
gaagatgttg 
catggaccaa 
ccatccaaat 
ttgtgctaat 
gtggaaaggt 
tgcatcaacg 
acaggcacta 
ggttttgcaa 
aatttattag 



acaccaaaag ggcctaaagt gaaatacttg 

agaggtatgg tgctgggcag tttagctgct 

gaagtacctg ccaattcaac tgtgctttcc 

gcatataagg attacctagc aagtggagga 

tgtacacaca ctggtacagg acaggcaatt 

gagtcctttg gtggtgcttc atgttgtctg 

cctaaaggat tctgtgactt gaaaggtaag 

gacccagtgg gttttacact tagaaacaca 

tatggctgta gttgtgacca actccgcgaa 

tttttaaacg ggtttgcggt gtaagtgcag 

gtactgatgt cgtctacagg gcttttgata 

agttcctaaa aactaattgc tgtcgcttcc 

actcttactt tgtagttaag aggcatacta 
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tacttcatca 
acagtacgtc 
ttctgtgctt 
caaccaatca 
actgtaacac 
tattgtagat 
tacgtccaaa 
gtctgtaccg 
cccttgatgc 
cccgtcttac 
tttacaacga 
aggagaagga 
tgtctaacta 



60 
120 
180 
240 
300 
360 
420 
480 
540 
600 
660 
720 
780 



1 er dep6t 









S226CAS108. 


ST25 




ccaacatgaa 


gagactattt 


ataacttggt 


taaagattgt 


ccagcggttg ctgtccatga 


840 


ctttttcaag 


tttagagtag 


atggtgacat 


ggtaccacat 


atatcacgtc agcgtctaac 


900 


taaatacaca 


atggctgatt 


tagtctatgc 


tctacgtcat 


tttgatgagg gtaattgtga 


960 


tacattaaaa 


gaaatactcg 


tcacatacaa 


ttgctgtgat 


gatgattatt tcaataagaa 


1020 


ggattggtat 


gacttcgtag 


agaatcctga 


catcttacgc 


gtatatgcta acttaggtga 


1080 


gcgtgtacgc 


caatcattat 


taaagactgt 


acaaHtctgc 


gatgctatgc gtgatgcagg 


1140 


cattgtaggc 


gtactgacat 


tagataatca 


ggatcttaat 


gggaactggt acgatttcgg 


1200 


tgatttcgta 


caagtagcac 


caggctgcgg 


agttcctatt 


gtggattcat attactcatt 


1260 


gctgatgccc 


atcctcactt 


tgactagggc 


attggctgct 


gagtcccata tggatgctga 


1320 


tctcgcaaaa 


ccacttatta 


agtgggattt 


gctgaaatat 


gattttacgg aagagagact 


1380 


ttgtctcttc 


gaccgttatt 


ttaaatattg 


ggaccagaca taccatccca attgtattaa 


1440 


ctgtttggat 


gataggtgta 


tccttcattg 


tgcaaacttt 


aatgtgttat tttctactgt 


1500 


gtttccacct 


acaagttttg 


gaccactagt 


aagaaaaata 


tttgtagatg gtgttccttt 


1560 


tgttgtttca 


actggatacc 


attttcgtga 


gttaggagtc gtacataatc aggatgtaaa 


1620 


cttacatagc 


tcgcgtctca 


gtttcaagga 


acttttagtg 


tatgctgctg atccagctat 


1680 


gcatgcagct 


tctggcaatt 


tattgctaga 


taaacgcact 


acatgctttt cagtagctgc 


1740 


actaacaaac 


aatgttgctt 


ttcaaactgt 


caaacccggt 


aattttaata aagactttta 


1800 


tgactttgct 


gtgtctaaag 


gtttctttaa 


ggaaggaagt 


tctgttgaac taaaacactt 


1860 


cttctttgct 


caggatggca 


acgctgctat 


cagtgattat 


gactattatc gttataatct 


1920 


gccaacaatg 


tgtgatatca 


gacaactcct 


attcgtagtt 


gaagttgttg ataaatactt 


1980 


tgattgttac 


gatggtggct 


gtattaatgc 


ca 




2012 


<210> 51 












<211> 1877 










<212> DNA 












<213> CORONAVIRUS 










<400> 51 

gtacttcgcg tacagtggca 


ataccatatg 


acagcttaaa tgtttcctca gtggctttga 


60 


gcgtttctgc tgcgaaaagc 


ttgagtctct 


cagtacaagt 


gttggcaagt atgtaatcgc 


120 


cagcattagt 


ccaatcacat 


gttgctatcg 


cattgaagtc 


agtgacattg tcactgccta 


180 


cacatgtgtt 


tttgtataaa 


ccaaaaacct 


gaccattagc 


acataatgga aaactaatgg 


240 


gaggcttatg 


tgacttgcaa 


taatagctca 


tacctcctag 


atacagttgt gtcacatcag 


300 


tgacatcaca 


acctggggca 


ttgcaaacat 


agggattaac 


agacaacact aatttgtgtg 


360 


atgttgaaat 


gacatggtca 


tagcagcact 


tgcaacatag gaatggtctc ctaatacagg 
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420 



caccgcaacg 
ctgtatgtgg 
cattagttag 
ttctaatgta 
taagtgggta 
ttttgacaat 
gcaggtacac 
gaggtccttt 
tttgataata 
agttactgtt 
gcaggtaagc 
actcatagag 
ttgaaagaag 
cataagcagt 
cacacatgac 
gtgataagtt 
gcatgttagg 
ctacatcact 
caattaccac 
gtctatttgt 
cactaatggc 
acgcgaaaag 
cccatttatt 
cattaataca 
ggagttgtct 



aagtgaagtc 
tgtgtacata 
cattacggaa 
ttgtaaatac 
agcatcaata 
atcatcgaca 
gtaatcatct 
agtaaggtca 
aagaactgcc 
atagcacaca 
gtaaaactca 
cctgtgttgt 
tgcatttaca 
tgtagcatca 
catctcactt 
acagcaagtg 
catggctctg 
gtaaacagtt 
agtagctcct 
catagtacta 
atacttaaga 
tgcatcttga 
aaatgggaaa 
gccaccatcg 
gatatca 



tgtgaattgc 
gcctcataaa 
tacatgtcca 
aagtgaaaga 
gccagtgaca 
aaacagcctg 
ccttgtttaa 
gtctcagtcc 
ttaaagttct 
acggcatcat 
tccacgaatt 
agattgcgga 
ttggctgtaa 
ccggatgatg 
aatacttgcg 
ttatgtttgc 
tcacattttg 
trtaacatat 
ctagtggcgg 
cagatagaga 
ttcatttgag 
tcctcataac 
ccagctgatt 
taacaatcaa 



S226CAS108. 
acaatacaca 
actcaggttc 
acatgtggcc 
catcagcata 
cgaacctttc 
cgcctaatat 
ctagcattgt 
aacattttgc 
taatgctagc 
cagaaagaat 
catgatcaac 
catacttgtc 
cagcttgaca 
ttccacctgg 
cacactcgtt 
gagcaagaac 
gataatccca 
tatgccagcc 
ctattgactt 
caccagctac 
ttatagtagg 
tcattgagtc 
tatccagatt 
agtatttatc 



ST25 

agcacctaca 
ccagtaccgt 
agtaagctca 
ctcctgatta 
aatcataagt 
tcttgatgga 
atgctgtgag 
ctcagacatg 
tactaaacct 
catcatggag 
atccctattt 
agctatctta 
aatgttaaag 
tttaacatat 
agctaacctg 
aagagaggcc 
acccataagg 
accgtaaaac 
caataatttc 
ggtgcgagct 
gatgacatta 
ataataaagt 
gttaacgatt 
aacaacttca 



gcctgcaaga 

gaggtgttat 

tcatgtaact 

ggatgttttg 

gtaccatctg 

tctgggtaag 

caaaattcgt 

aacacattat 

tgagccgcat 

aaatgtttac 

ctatagagac 

ttaccatcag 

acactattag 

agtgagccgc 

tagaaacggt 

attatcctaa 

tgtggagttt 

ttgcttgttc 

tgatgaaact 

ctattctttg 

cgcttagtat 

ctagccttac 

acttggttgg 

acnacgaata 



480 
540 
600 
660 
720 
780 
840 
900 
960 
1020 
1080 
1140 
1200 
1260 
1320 
1380 
1440 
1500 
1560 
1620 
1680 
1740 
1800 
1860 
1877 



<210> 52 

<211> 2051 

<212> DNA 

<213> CORONAVIRUS 



<400> 52 

tcaggtccaa tcttgacaaa gtacttcatt 
acgaacacga ctctgtctga caatcctttc 
atacgcacta cattccaggg caagccttta 



gatgtaagct caaagccatg cgcccaaagg 60 

agtgtatcac tgagcatttg tactatctta 120 

tacatgagtg gtataagatg tttaaactgg 180 
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tcacctggtg gaggttttgc attaactctg gtgaattctg tgttattttc agtgtcaaca 240 

taaccagtcg gtacagctac taagttaaca cctgtagaaa atcctagctg gagaggtagg 300 

ttagtaccca cagcatctct agttgcatga cagccctcta catcaaagcc aatccacgca 360 

cgaacgtgac gaatagcttc ttcgcgggtg ataaacatat tagggtaacc attgacttgg 420 

taattcattt tgaaacccat catagagatg agtctacggt aggtcatgtc ctttggtatg 480 

cctggtatgt caacacataa tccttcagtc ttgaacttta tatcaacgct gaggtgtgta 540 

ggtgcctgtg taggatgaag accagtaatg atcttactac agtccttaaa aagtccagtt 600 

acattttctg cttgtaatgt agccacattg cgacgtggta tttctagact tgtaaattgc 660 

agtttgtcat aaagatctct atcagacatt atgcacaaaa tgccaatttt tgcccttgtg 720 

atagccacat tgaagcggtt gacattacaa gagtgtgctg tttcagtagt ttgtgtgaat 780 

atgacatagt catattcaga accctgtgat gaatcaacag tctgcgtagg caatcctaag 840 

atttttgaag ctacagcgtt ctgtgaatta taaggtgaga taaaaacagc ttttctccaa 900 

gcaggattgc gtgtaagaaa ttctcttaca acgcctattt gaggtctgtt gattgcagat 960 

gaaacatcat gtgtaataac acctttgtag aacattttga agcattgagc tgacttatcc 1020 

ttgtgtgctt ttagcttatt gtcataaact aaagcactca cagtgtcaac aatttcagca 1080 

ggacaacggc gacaagttcc aaggaacatg tctggaccta ttgttttcat aagtctgcac 1140 

actgaattaa aatattctgg ttctagtgtg cctttagtca gcaatgtgcg gggggctggt 1200 

aattgagcag gatcgccaat atagacgtag tgttttgcac gaagtctagc attgacaaca 1260 

ctcaagtcat aattagtagc catagagatt tcatcaaaga ctacaatgtc agcagttgtt 1320 

tctggcaatg catttacagt gcagaaaaca tactgttcta gtgttgaatt cactttgaat 1380 

ttatcaaaac actctacgcg cgcacgcgca ggtatgattc tactacattt atctatgggc 1440 

aaatatttta atgccttttc acatagggca tcaacagctg catgagagca tgccgtatac 1500 

actatgcgag cagatgggta atagagagca agtccgatgg caaaatgact cttaccagta 1560 

ccaggtggtc cttggagtgt agagtacttt tgcatgccga ccttttgata atttgcaaca 1620 

ttgctagaaa actcatctga gatgttgagt gttgggtaca agccagtaat tctcacatag 1680 

tgctcttgtg gcactagagt aggtgcacta agtggcatta cagtgtgaga tgtcaacaca 1740 

aagtaatcac caacattcaa cttgtatgtc gtagtacctc tgtacacaac agcatcacca 1800 

tagtcacctt tttcaaaggt gtactctcca atctgtactt tactattttt agttacacgg 1860 

taaccagtaa agacatagtt tctgttcaat ggtggtctag gttttccaac ctcccatgaa 1920 

agatgcaatt ctctgtcaga gagtacttcg cgtacagtgg caataccata tgacagctta 1980 

aatgtttcct cagtggcttt gagcgtttct gctgcgaaaa gcttgagtct ctcagtacaa 2040 

gtgttggcaa g 2051 



.<210> 53 
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<211> 2075 

<212> DNA 

<213> CORONAVIRUS 



<400> 53 
tgcttgtagt 



aatttcagca 
ctttattatc 
tgaacctgtt 
atcctctaat 
accgccaagt 
gagcttatat 
tgatctgggc 
ttgaataatg 
taatgtgact 
tgaaccttct 
cactctacca 
aatgtcagtc 
gtcccagatt 
tggcactggt 
tgtcttattt 
aatgatggaa 
ataagccaca 
aaattgtrtg 
gtactgtcgg 
aatacacgta 
agactcacaa 
acttttatcg 
acagcctggt 
ggctgggtaa 
gtgatgtgta 
ctgagcatcg 
atttccaatg 
gtgttgtact 
aacagaccaa 



tttgggtaga 
tagtcaattg 
tcgacaaagt 
tgcgcatctg 
ttaagtggtg 
tgtccatgac 
cgctgtatga 
ttaaaatxct 
ccgtctactt 
ccattgacgc 
gttattaaaa 
tcaaacaaga 
attgtgcaga 
acagtattag 
ttaatgttac 
tcaaagatct 
acaggtgctt 
ttttctaaac 
taaanccata 
tactcatttg 
gcagatttga 
ggactatcag 
aaagctggag 
aagttcaagt 
cgatcaacgt 
gcataagaat 
tagaacttcc 
tcatgaagaa 
tttctgcaag 
tcaacgcgct 



aggtttcaac 
taaccttgac 
catcaagtaa 
ttatgaagta 
aatcttgtga 
tgaaatctcc 
antcatccat 
ctaagtctct 
tcttaaagta 
nagcttgtgc 
caccattacg 
cagtaagtga 
cacctattgt 
cagcgatatc 
gcttagccca 
ccacatcaat 
cgccggcgtg 
tctgtaacct 
ggctaaatcc 
catggtgtct 
gtggaacata 
aatagtaaaa 
tgtggaatgc 
ttgacaagac 
tacaattcca 
agaagagttc 
attctacttc 
ctggaaactt 
cagaattaac 
taacaaagca 



atgtccatcc ttacaccaaa 
cacttttgaa atcactgaca 
aagatcaatc acagaacaca 
atttttcact gtgctgtcca 
gcgcttggct aagcctatca 
ataaacgatg tgttcgaagg 
agcgagctcg agaaagtcag 
gctctgagta aagtaggttt 
gttaaactgt gtttttactg 
tggtcccttt gaaggtgtta 
ggcgtttcta aaaaggtcta 
agaacaagca ctctcagtag 
agatacatgt gctggggctt 
aacacccaaa ttattgagta 
aagctcaaat gcaacattaa 
accatctacc tttgtgtaaa 
tccatcaaag tgtcctttat 
ggtaaatgta ttccacaggt 
agcagaaatic atcatartat: 
gcaaacagca ccacctaaat 
atcaatatcc gacactactt 
gaaaggcaat tgctttaaat 
atgcttattc acatacaaac 
tcttgtgtca aacctacaca 
aaacaaacaa acaccatcag 
ctctattttg taagctttgt 
agcctgaggc acacacttga 
atcagcaagc aatgcagact 
cctcagttca tctcctataa 



ctcatggact gctaaacatc 
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gcatgaatga 
aatcttgtga 
cacattttga 
tagggataaa 
ttaaatgaag 
catagccctc 
tttccatttg 
caggcaactg 
attctccaat 
gacctttgac 
cctgtccttc 
gtttcttggc 
ctcttttgta 
tcttaatctc 
caggaagtgt 
cagcattatt 
taacaacatt 
tataagtatc 
atgcatccaa 
tgcatcgtgt 
gtttgccatg 
tagtaaatgc 
taccaccatc 
caattgcatt 
tgaatttatc 
cactacatgg 
tagcctttgg 
tcacaaccat 
tagggtattc 
tagtcatgat 



60 
120 
180' 
240 
300 
360 
420 
480 
540 
600 
660 
720 
780 
840 
900 
960 
1020 
1080 
1140 
1200 
1260 
1320 
1380 
1440 
1500 
1560 
1620 
1680 
1740 
1800 
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agcatcacaa 


ctagccacat 


gtgcatttcc 


atgtacctgg caatgttggt catggttact 


1860 


ctgaaggtta cccgtaaagc 


cccactgctg 


aacatcaatc ataaatgggt tatagacata 


1920 


gtcaaaaccc 


acagaatgat 


tccagcaggc 


ataagtatct gatgaagtag aaaagcaagt 


1980 


tgcacgtttg tcacacagac 


aacacgttct 


ttcaggtcca atcttgacaa agtacttcat 


2040 


tgatgtaagc tcaaagccat 


gcgcccaaag 


gacga 


2075 


<210> 54 










<211> 1891 








<212> DNA 










<213> CORONAVIRUS 








<400> 54 
aagattcacc 


acttaaatta 


gaggatttta 


tccctatgga cagcacagtg aaaaattact 


60 


tcataacaga 


tgcgcaaaca 


ggttcatcaa 


aatgtgtgtg ttctgtgatt gatcttttac 


120 


ttgatgactt 


tgtcgagata 


ataaagtcac 


aagatttgtc agtgatttca aaagtggtca 


180 


aggttacaat 


tgactatgct 


gaaatttcat 


tcatgctttg gtgtaaggat ggacatgttg 


240 


aaaccttcta 


cccaaaacta 


caagcaagtc 


aagcgtggca accaggtgtt gcgatgccta 


300 


acttgtacaa 


gatgcaaaga 


atgcttcttg 


aaaagtgtga ccttcagaat tatggtgaaa 


360 


atgctgttat 


accaaaagga 


ataatgatga 


atgtcgcaaa gtatactcaa ctgtgtcaat 


420 


arftaaatar 


arfta rt"Tfa 


gctgtaccct 


acaacatgag agttattcac tttggtgctg 


480 


gctctgataa 


aggagttgca 


ccaggtacag 


ctgtgctcag acaatggttg ccaactggca 


540 


cactacttgt 


cgattcagat 


cttaatgact 


tcgtctccga cgcagattct actttaattg 


600 


gagactgtgc 


aacagtacat 


acggctaata 


aatgggacct tattattagc gatatgtatg 


660 


accctaggac 


caaacatgtg 


acaaaagaga 


atgactctaa agaagggttt ttcacttatc 


720 


tgtgtggatt 


tataaagcaa 


aaactagccc 


tgggtggttc tatagctgta aagataacag 


780 


agcattcttg 


gaatgctgac 


ctttacaagc 


ttatgggcca tttctcatgg tggacagctt 


840 


ttgttacaaa 


tgtaaatgca 


tcatcatcgg 


aagcattttt aattggggct aactatcttg 


900 


gcaagccgaa 


ggaacaaatt 


gatggctata 


ccatgcatgc taactacatt ttctggagga 


960 


acacaaatcc 


tatccagttg 


tcttcctatt 


cactctttga catgagcaaa tttcctctta 


1020 


aattaagagg 


aactgctgta 


atgtctctta 


aggagaatrca aatcaatgat atgatttatt 


1080 


ctcttctgga 


aaaaggtagg 


cttatcatta 


gagaaaacaa cagagttgtg gtttcaagtg 


1140 


atattcttgt 


taacaactaa 


acgaacatgt 


ttattttctt attatttctt actctcacta 


1200 


gtggtagtga 


ccttgaccgg 


tgcaccactt 


ttgatgatgt tcaagctcct aattacactc 


1260 


aacatacttc 


atctatgagg 


ggggtttact 


atcctgatga aatttttaga tcagacactc 


1320 


tttatttaac 


tcaggattta 


tttcttccat 


tttattctaa tgttacaggg tttcatacta 
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1er depot. 



S226CAS108.ST25 



utaatcatac 


gtttggcaac cctgtcatac cttttaagga tggtatttat tttgctgcca 


1 AAC\ 


cagagaaatc 


uaa LljLLljLL 


cgtggttggg tttttggttc taccatgaac 


aacaagtcac 


l!>UU 


agtcggtgat 


tattattaac 


aattctacta atgttgttat acgagcatgt 


aactttgaat 


1560 


tgtgtgacaa 


ccctttcttt 


gctgtttcta aacccatggg tacacagaca 


catactatga 


1620 


tattcgataa 


tgcatttaat 


tgcactttcg agtacatatc tgatgccttt 


tcgcttgatg 


1680 


tttcagaaaa 


gtcaggtaat 


tttaaacact tacgagagtt tgtgtttaaa aataaagatg 


1740 


ggtttctcta 


tgtttataag 


ggctatcaac ctatagatgt agttcgtgat 


ctaccttctg 


1800 


gttttaacac 


tttgaaacct 


atttttaagt tgcctcttgg tattaacatt 


acaaatttta 


1860 


gagccattct 


tacagccttt 


tcacctgctc a 




1891 



<210> 55 

<211> 32 

<212> DNA 

<213> ARTIFICIAL SEQUENCE 



<220> 

<223> amorce N sens 

<400> 55 

cccatatgtc tgataatgga ccccaatcaa ac 32 

<210> 56 

<211> 32 

<212> DNA 

<213> artificial sequence 



<220> 

<223> amorce N antisens 

<400> 56 

cccccgggtg cctgagttga atcagcagaa gc 32 

<210> 57 

<211> 31 

<212> DNA 

<213> artificial sequence 



<220> 
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<223> amorce sc sens 
<400> 57 

cccatatgag tgaccttgac cggtgcacca c 



<210> 58 

<211> 30 

<212> DNA 

<213> artificial sequence 
<220> 

<223> amorce SL sens 

<400> 58 

cccatatgaa accttgcacc ccacctgctc 

<210> 59 

<211> 33 

<212> DNA 

<213> amorce Sc et SL antisens 

<400> 59 

cccccgggtt taatatattg ctcatatttt ccc 

<210> 60 

<211> 16 

<212> DNA 

<213> amorce sens serie 1 



30 



33 



<400> 60 
ggcatcgtat gggttg 

<210> 61 

<211> 16 

<212> DNA 

<213> amorce antisens serie 2 C28774-28759) 



<400> 61 
cagtttcacc acctcc 



<210> 62 
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<211> 



16 



<212> 



DNA 



<213> 



amorce sens serie 2 C28375-28390) 



<400> 



62 



16 



ggctactacc gaagag 

<210> 63 
<211> 16 
<212> DNA 

<213> amorce antisens serie 2 (28702-28687) 

<400> 63 16 
aattaccgcg actacg 

<210> 64 
<211> 26 
<212> DNA 

<213> sonde 1/serie 1 (28561-28586) 

<400> 64 26 
ggcacccgca atcctaataa caatgc 

<210> 65 
<211> 21 
<212> DNA 

<213> sonde 2/serie 1 (28588-28608) 

<400> 65 2] 
gccaccgtgc tacaacttcc t 

<210> 66 
<211> 23 
<212> DNA 

<213> sonde 1/serie 2 /sonde n/fl (28541-28563) 

<400> 66 2 
atacacccaa agaccacatt ggc 
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<210> 67 
<211> 25 
<212> DNA 

<213> sonde 2/serie 2/sonde SARS/N/LC705 (28565-28589) 
<400> 67 

cccgcaatcc taataacaat gctgc 

<210> 68 

<211> 30 

<212> DNA 

<213> artificial sequence 
<220> 

<223> amorce ancre 14T 

<400> 68 

agatgaattc ggtacctttt tttttttttt 

<210> 69 

<211> 13 

<212> PRT 

<213> artificial sequence 
<220> 

<223> peptide M2-14 

<400> 69 

Ala Asp Asn Gly Thr lie Thr Val Glu Glu Leu Lys Gin 
1 5 10 

<210> 70 

<211> 12 

<212> PRT 

<213> arti f i ci al sequence 
<220> 

<223> peptide El-12 

<400> 70 
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Met Tyr Ser Phe Val ser Glu Glu Thr Gly Thr Leu 

<210> 71 

<211> 24 

<212> PRT 

<213> artificial sequence 



<220> 

<223> peptide E53-72 
<400> 71 

Lys Pro Thr val Tyr Val Tyr Ser Arg Val Lys Asn Leu Asn Ser Ser 



Glu Gly val Pro Asp Leu Leu val 
20 



<210> 72 

<211> 153 

<212> DNA 

<213> CORONAVIRUS 



ga?attaggt ttttacctac ccaggaaaag ccaaccaacc tcgatctctt gtagatctgt 60 
tctctaaacg aactttaaaa tctgtgtagc tgtcgctcgg ctgcatgcct agtgcaccta 120 
cgcagtataa acaataataa attttactgt cgt 



<210> 73 

<211> 410 

<212> DNA 

<213> CORONAVIRUS 



tt??ccagac aacttcaaaa ttccatgagt ggagcttctg ctgattcaac tcaggcataa 60 
acactcatga tgaccacaca aggcagatgg gctatgtaaa cgttttcgca attccgttta 120 
cgatacatag tctactcttg tgcagaatga attctcgtaa ctaaacagca caagtaggtt 
tagttaactt taatctcaca tagcaatctt taatcaatgt gtaacattag ggaggacttg 
aaagagccac cacattttca tcgaggccac gcggagtacg atcgagggta cagtgaataa 
tgctagggag agctgcctat atggaagagc cctaatgtgt aaaattaatt ttagtagtgc 



180 
240 
300 
360 



1 er depot 



S226CAS108-ST25 

tatccccatg tgattttaat agcttcttag gagaatgaca aaaaaaaaaa 410 

<210> 74 

<211> 4382 

<212> PRT 

<213> CORONAVIRUS 

<400> 74 

Met Glu Ser Leu val Leu Gly val Asn Glu Lys Thr His val Gin Leu 
15 10 15 

ser Leu Pro val Leu Gin val Arg Asp val Leu val Arg Gly Phe Gly 
20 25 30 

Asp Ser val Glu Glu Ala Leu Ser Glu Ala Arg Glu His Leu Lys Asn 
35 40 ~ 45 

Gly Thr cys Gly Leu val Glu Leu Glu Lys Gly val Leu Pro Gin Leu 
50 55 60 

Glu Gin Pro Tyr Val Phe He Lys Arg Ser Asp Ala Leu Ser Thr Asn 
65 70 75 80 

His Gly His Lys val val Glu Leu val Ala Glu Met Asp Gly lie Gin 
85 90 95 

Tyr Gly Arg ser Gly lie Thr Leu Gly Val Leu val Pro His val Gly 
100 105 110 

Glu Thr Pro lie Ala Tyr Arg Asn val Leu Leu Arg Lys Asn Gly Asn 
115 120 125 

Lys Gly Ala Gly Gly His Ser Tyr Gly lie Asp Leu Lys Ser Tyr Asp 
130 ' 135 140 

Leu Gly Asp Glu Leu Gly Thr Asp Pro He Glu Asp Tyr Glu Gin Asn 
145 150 155 160 

Trp Asn Thr Lys His Gly Ser Gly Ala Leu Arg Glu Leu Thr Arg Glu 
165 170 175 

Leu Asn Gly Gly Ala val Thr Arg Tyr val Asp Asn Asn Phe Cys Gly 
180 185 190 

Pro Asp Gly Tyr Pro Leu Asp cys lie Lys Asp Phe Leu Ala Arg Ala 
195 200 205 
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Gly Lys ser Met Cys Thr Leu ser Glu Gin Leu Asp Tyr lie Glu ser 
210 215 

Lys Arg Gly val Tyr cys cys Arg Asp His Glu His Glu lie Ala Trg 
225 230 z 

Phe Thr Glu Arg Ser Asp Lys ser Tyr Glu His Gin Thr Pro Phe Glu 
245 z:>u 

lie Lys ser Ala Lys Lys Phe Asp Thr Phe Lys Gly Glu Cys Pro Lys 
260 2 65 z/u 

Phe val Phe Pro Leu Asn ser Lys Val Lys val He Gin Pro Arg Val 
275 280 ^ 

Glu Lys Lys Lys Thr Glu Gly Phe Met Gly Arg lie Arg ser Val Tyr 
290 295 3UU 

pro val Ala ser Pro Gin Glu cys Asn Asn Met His Leu Ser Thr Leu 
305 310 315 

Met Lys cys Asn His cys Asp Glu val ser Trp Gin Thr Cys Asp Phe 

Leu Lys Ala Thr cys Glu His Cys Gly Thr Glu Asn Leu Val He Glu 
340 345 3->° 

Gly Pro Thr Thr Cys Gly Tyr Leu Pro Thr Asn Ala val val Lys Met 
7 355 360 365 

pro Cys Pro Ala Cys Gin Asp Pro Glu He Gly Pro Glu His Ser val 
370 375 380 

Ala Asp Tyr His Asn His ser Asn He Glu Thr Arg Leu Arg Lys Gly 
385 390 395 ™« 

Gly Arg Thr Arg cys Phe Gly Gly Cys val Phe Ala Tyr val Gly cys 

Tyr Asn Lys Arg Ala Tyr Trp val Pro Arg Ala ser Ala A|p lie Gly 

ser Gly His Thr Gly lie Thr Gly Asp Asn val Glu Thr Leu Asn Glu 
435 440 445 

Asp Leu Leu Glu He Leu Ser Arg Glu Arg val Asn He Asn lie Val 
450 455 460 

Gly Asp Phe His Leu Asn Glu Glu val Ala lie He Leu Ala ser Phe 
465 470 475 
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Ser Ala Ser Thr Ser Ala Phe lie Asp Thr He Lys ser Leu Asp Tyr 
485 490 495 

Lys Ser Phe Lys Thr lie Val Glu ser Cys Gly Asn Tyr Lys val Thr 
500 505 510 

Lvs Glv Lys Pro Val Lys Gly Ala Trp Asn lie Gly Gin Gin Arg Ser 
515 520 525 

val Leu Thr Pro Leu cys Gly Phe Pro Ser Gin Ala Ala Gly val lie 
530 535 540 

Arq Ser lie Phe Ala Arg Thr Leu Asp Ala Ala Asn His Ser lie Pro 
545 550 555 560 

Asp Leu Gin Arg Ala Ala Val Thr lie Leu Asp Gly lie ser Glu Gin 
565 570 575 

Ser Leu Arg Leu val Asp Ala Met Val Tyr Thr ser Asp Leu Leu Thr 
580 585 590 

Asn ser Val He lie Met Ala Tyr val Thr Gly Gly Leu val Gin Gin 
595 600 605 

Thr ser Gin Trp Leu ser Asn Leu Leu Gly Thr Thr Val Glu Lys Leu 
610 615 620 

Arq Pro lie Phe Glu Trp lie Glu Ala Lys Leu Ser Ala Gly Val Glu 
625 630 635 640 

Phe Leu Lys Asp Ala Trp Glu lie Leu Lys Phe Leu lie Thr Gly Val 
645 650 655 

Phe Asp lie Val Lys Gly Gin lie Gin val Ala Ser Asp Asn lie Lys 
660 665 670 

Asp cys val Lys Cys Phe lie Asp val val Asn Lys Ala Leu Glu Met 
675 680 685 

cys lie Asp Gin Val Thr He Ala Gly Ala Lys Leu Arg Ser Leu Asn 
690 695 700 

Leu Gly Glu val Phe lie Ala Gin Ser Lys Gly Leu Tyr Arg Gin Cys 
705 710 715 720 

lie Arq Gly Lys Glu Gin Leu Gin Leu Leu Met Pro Leu Lys Ala Pro 
725 730 735 

Lys Glu val Thr Phe Leu Glu Gly Asp Ser His Asp Thr val Leu Thr 
740 745 750 
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Ser Glu Glu Val Val Leu Lys Asn Gly Glu Leu Glu Ala Leu Glu Thr 
755 /ou 

Pro val Asp ser Phe Thr Asn Gly Ala He val f y Thr Pro Val Cys 
770 775 

Val Asn Gly Leu Met Leu Leu Glu He Lys Asp Lys Glu Gin Tyr cys 
785 790 

Ala Leu ser Pro Gly Leu Leu Ala Thr Asn Asn val Phe Arg Leu Lys 

Gly Gly Ala Pro He Lys Gly val Thr Phe Gly Glu Asp Thr val Trp 
820 B " 

Glu val Gin Gly Tyr Lys Asn val Arg He Thr Phe Glu Leu Asp Glu 
835 840 0£ " 

Arg val Asp Lys val Leu Asn Glu Lys Cys ser Val Tyr Thr Val Glu 
850 855 0 

Ser Gly Thr Glu val Thr Glu Phe Ala Cys Val val Ala Glu Ala Val 
865 870 875 

val Lys Thr Leu Gin Pro val ser Asp Leu Leu Thr Asn Met Gly He 



885 



Asp Leu Asp Glu Trp Ser val Ala Thr Phe Tyr Leu Phe Asp Asp Ala 



900 



Gly Glu Glu Asn Phe Ser Ser Arg Met Tyr cys Ser Phe Tyr Pro Pro 



915 

Asp Glu Glu Glu Glu Asp Asp Ala Glu Cys Glu Glu Glu Glu He Asp 
930 935 

Glu Thr cys Glu His Glu Tyr Gly Thr Glu Asp Asp Tyr Gin Gly Leu 

Pro Leu Glu Phe |g Ala ser Ala Glu Thr val Arg val Glu Glu Glu 

Glu Glu Glu Asp Trp Leu Asp Asp Thr Thr Glu Gin ser Glu He Glu 
980 985 

Pro Glu Pro Glu Pro Thr Pro Glu Glu Pro val Asn Gin Phe Thr Gly 
995 1000 xv v j 

Tyr Leu Lys Leu Thr Asp Asn val Ala He Lys Cys val Asp He 
1010 1015 
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val Lvs Glu Ala Gin Ser Ala Asn Pro Met Val lie val Asn Ala 
1&25 1030 1035 

Ala Asn He His Leu Lys His Gly Gly Gly val Ala Gly Ala Leu 
1040 1045 1050 

Asn lvs Ala Thr Asn Gly Ala Met Gin Lys Glu Ser Asp Asp Tyr 
1055 1060 1065 

lie Lys Leu Asn Gly Pro Leu Thr val Gly Gly ser Cys Leu Leu 
1070 1075 1080 

ser Gly His Asn Leu Ala Lys Lys cys Leu His val val Gly Pro 
1085 1090 1095 

Asn Leu Asn Ala Gly Glu Asp He Gin Leu Leu Lys Ala Ala Tyr 
1100 1105 1110 

Glu Asn Phe Asn ser Gin Asp lie Leu Leu Ala Pro Leu Leu ser 
1115 1120 1125 

Ala Gly He Phe Gly Ala Lys Pro Leu Gin Ser Leu Gin val cys 
1130 H35 1140 

Val Gin Thr Val Arg Thr Gin Val Tyr lie Ala Val Asn Asp Lys 
1145 1150 1155 

Ala Leu Tyr Glu Gin val Val Met Asp Tyr Leu Asp Asn Leu Lys 
1160 1165 1170 

Pro Arg val Glu Ala Pro Lys Gin Glu Glu Pro Pro Asn Thr Glu 
1175 1180 1185 

Asp Ser Lys Thr Glu Glu Lys ser val val Gin Lys Pro Val Asp 
1190 1195 1200 

val Lys Pro Lys lie Lys Ala cys He Asp Glu Val Thr Thr Thr 
1205 1210 1215 

Leu Glu Glu Thr Lys Phe Leu Thr Asn Lys Leu Leu Leu Phe Ala 
1220 1225 1230 

Asp lie Asn Gly Lys Leu Tyr His Asp Ser Gin Asn Met Leu Arg 
1235 1240 1245 

Gly Glu Asp Met Ser Phe Leu Glu Lys Asp Ala Pro Tyr Met val 
1250 1255 1260 

Gly Asp val lie Thr ser Gly Asp lie Thr Cys Val val He Pro 
1265 1270 1275 
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ser Lys Lys Ala Gly Gly Thr Thr Glu Met Leu Sen Arg Ala Leu 
1280 1285 x 

Lys Lys Val Pro Val Asp Glu Tyr He Thr Thr Tyr Pro Gly Gin 
1295 1300 

Gly cys Ala Gly Tyr Thr Leu Glu Glu Ala Lys Thr Ala Leu Lys 
1310 1315 XiiU 

Lys cys Lys ser Ala Phe Tyr val Leu Pro Ser Glu Ala pro Asn 
1325 1330 ±333 

Ala Lys Glu Glu lie Leu Gly Thr Val ser Trp Asn Leu Arg Glu 
1340 1345 

Met Leu Ala His Ala Glu Glu Thr Arg Lys Leu Met Pro lie Cys 
1355 1360 

Met Asp val Arg Ala He Met Ala Thr He Gin Arg Lys Tyr Lys 
1370 1375 X38U 

Gly lie Lys He Gin Glu Gly He val Asp Tyr Gly Val Arg Phe 
1385 1390 -Lay* 

Phe Phe Tyr Thr Ser Lys Glu Pro val Ala ser lie lie Thr Lys 
1400 1405 X4J.U 

Leu Asn ser Leu Asn Glu Pro Leu val Thr Met Pro He Gly Tyr 
1415 1420 I*" 

val Thr His Gly Phe Asn Leu Glu Glu Ala Ala Arg Cys Met Arg 
1430 1435 144U 

ser Leu Lys Ala Pro Ala val val ser Val ser ser Pro Asp Ala 
1445 1450 

val Thr Thr Tyr Asn Gly Tyr Leu Thr Ser Ser ser Lys Thr Ser 
1460 I 465 14/u 

Glu Glu His Phe val Glu Thr Val Ser Leu Ala Gly ser Tyr Arg 
I475 1480 148 S 

Asp Trp ser Tyr Ser Gly Gin Arg Thr Glu Leu Gly val Glu Phe 
1490 1495 15WJ 

Leu Lys Arg Gly Asp Lys lie val Tyr His Thr Leu Glu ser Pro 
1505 1510 1513 

val Glu Phe His Leu Asp Gly Glu val Leu ser Leu Asp Lys Leu 
1520 1525 1530 
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Lys Ser Leu Leu Ser Leu Arg Glu val Lys Thr lie Lys Val Phe 
1535 1540 1545 

Thr Thr val Asp Asn Thr Asn Leu His Thr Gin Leu Val Asp Met 
1550 1555 1560 

Ser Met Thr Tyr Gly Gin Gin Phe Gly Pro Thr Tyr Leu Asp Gly 
1565 1570 1575 

Ala Asp Val Thr Lys lie Lys Pro His val Asn His Glu Gly Lys 
1580 1585 1590 

Thr Phe Phe val Leu Pro ser Asp Asp Thr Leu Arg Ser Glu Ala 
1595 1600 1605 

Phe Glu Tyr Tyr His Thr Leu Asp Glu ser Phe Leu Gly Arg Tyr 
1610 1615 1620 

Met Ser Ala Leu Asn His Thr Lys Lys Trp Lys Phe Pro Gin val 
1625 1630 1635 

Gly Gly Leu Thr Ser lie Lys Trp Ala Asp Asn Asn Cys Tyr Leu 
1640 1645 1650 

Ser Ser val Leu Leu Ala Leu Gin Gin Leu Glu val Lys Phe Asn 
1655 1660 1665 

Ala Pro Ala Leu Gin Glu Ala Tyr Tyr Arg Ala Arg Ala Gly Asp 
1670 1675 1680 

Ala Ala Asn Phe cys Ala Leu lie Leu Ala Tyr ser Asn Lys Thr 
1685 1690 1695 

Val Gly Glu Leu Gly Asp val Arg Glu Thr Met Thr His Leu Leu 
1700 1705 1710 

Gin His Ala Asn Leu Glu Ser Ala Lys Arg Val Leu Asn Val Val 
1715 1720 " 1725 

Cys Lys His Cys Gly Gin Lys Thr Thr Thr Leu Thr Gly Val Glu 
1730 * 1735 1740 

Ala Val Met Tyr Met Gly Thr Leu Ser Tyr Asp Asn Leu Lys Thr 
1745 1750 1755 

Gly val Ser lie Pro Cys Val cys Gly Arg Asp Ala Thr Gin Tyr 
1760 1765 1770 

Leu val Gin Gin Glu ser Ser Phe val Met Met Ser Ala Pro Pro 
1775 1780 1785 
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Ala Glu Tyr Lys Leu Gin Gin Gly Thr Phe Leu Cys Ala Asn Glu 
1790 1795 

Tyr Thr Gly Asn Tyr Gin cys Gly His Tyr Thr His He Thr Ala 
1805 1810 

L ys Glu Thr Leu Tyr Arg lie Asp Gly Ala His Leu Thr Lys Met 
1820 1825 

ser Glu Tyr Lys Gly Pro val Thr Asp val Phe Tvr Lys Glu Thr 
1835 1840 

ser Tyr Thr Thr Thr He Lys Pro val ser Tyr Lys Leu Asp Gly 
1850 lo5i> 

val Thr Tyr Thr Glu He Glu Pro Lys Leu Asp Gly Tyr Tyr Lys 
1865 1870 

Lys Asp Asn Ala Tyr Tyr Thr Glu Gin Pro He Asp Leu Val Pro 
1880 1885 

Thr Gin Pro Leu Pro Asn Ala Ser Phe Asp Asn Phe Lys Leu Thr 
1895 1900 iy 

cys ser Asn Thr Lys Phe Ala Asp Asp Leu Asn Gin Met Thr Gly 
1910 1915 ±vc\j 

Phe Thr Lys Pro Ala ser Arg Glu Leu Ser Val Thr Phe Phe Pro 
1925 1930 

Asp Leu Asn Gly Asp val val Ala He Asp Tyr Arg His Tyr Ser 
1940 1945 xy 

Ala ser Phe Lys Lys Gly Ala Lys Leu Leu His Ly| Pro He Val 
1955 1960 iyb:> 

Trp His lie Asn Gin Ala Thr Thr Lys Thr Thr Phe Lys Pro Asn 
1970 1975 x^ou 

Thr Trp cys Leu Arg cys Leu Trp Ser Thr Lys pro Val Asp Thr 
1985 1990 

ser Asn Q Ser Phe Glu val Leu $ Ala Val Glu Asp Thr^ Gin Gly Met 

Asp Asn Leu Ala Cys Glu Ser Gin Gin Pro Thr ser Glu Glu val 
2015 2020 2025 

val Glu Asn Pro Thr He Gin Lys Glu Val lie Glu cys Asp Val 
2030 2035 
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Lys l£ r .- Thr Glu Va1 Va1 Gl V Asn v a1 He Leu Lys Pro ser Asp 
2045 2050 2055 

Glu Val Val Thr Gin Glu Leu Gly His Glu Asp Leu Met 

2060 2065 2070 

Ala A ! a Ty Va1 Glu Asn Thr ser lie Thr He Lys Lys Pro Asn 
2075 2080 2085 

Glu kSL Ser Leu Ala Leu Gl y Leu L y s Thr He A la Thr His Gly 
2090 2095 2100 

Ile ^2- Ala Ile Asn ser Val Pro Tr P Ser Lys lie Leu Ala Tyr 
2105 2110 2115 

Val t y ™ Pro phe Leu Gly Gin Ala Ala lie Thr Thr ser Asn cys 
2120 2125 2130 

Ala Ar 9 Leu Ala Gin Arg Val Phe Asn Asn Tyr Met Pro- Tyr 

2135 2140 2145 

Val Tnr Leu Leu phe Gln Leu Cys Thr Phe Thr Lys ser Thr 

2150 2155 2160 

Asn f?£r Arg I1e Arg Ala Ser Leu Pro Tnr Th r He Ala Lys Asn 
2165 2170 2175 

Ser Y?L Lys Ser Va1 Ala Lys Leu c y s Leu As P Ala Gly lie Asn 
2180 2185 2190 

Tyr o?Ic Lys ser pro L y s phe ser L y s Le " Phe Thr lie Ala Met 
2195 2200 2205 

Trp tS u « Leu Leu Leu Ser 11 e c y s "-eu Gly ser Leu lie Cys Val 
2210 2215 2220 

Thr A ![ a Ala Phe Gly Val Leu Leu ser Asn Phe Gly Ala Pro ser 
2225 2230 2235 

Tyr 9f?« Asn Gly Val Ar 9 Glu Le " Tyr Leu Asn Ser Ser Asn Val 
2240 2245 2250 

Thr Thr Met Asp Phe cys Glu Gly ser Phe Pro Cys ser lie Cys 
2255 2260 2265 

Leu Se ^ Gly Leu As P Ser Le " Asp ser Tyr Pro Ala Leu Glu Thr 
2270 2275 2280 

I1e G l" Val Tnr Il e ser ser Tyr Lys Leu Asp Leu Thr lie Leu 
2285 2290 2295 
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Gly Leu Ala Ala Glu Trp Val Leu Ala Tyr Met Leu Phe Thr Lys 
2300 2305 

Phe Phe Tyr Leu Leu Gly Leu ser Ala He Met Gin val Phe Phe 
2315 2320 

Gly T yr Phe Ala ser His Phe He Ser Asn ser Trp Leu Met Trp 
2330 2335 " 

Phe He He Ser lie val Gin Met Ala Pro Val Ser Ala Met val 
2345 2350 

Arg Met Tyr He Phe Phe Ala Ser Phe Tyr Tyr lie Trp Lys Ser 
2360 2365 " 

Tyr val His He Met Asp Gly cys Thr ser Ser Thr cys Met Met 
y 2375 2380 

cys Tyr Lys Arg Asn Arg Ala Thr Arg Val Glu cys Thr Thr He 
2390 2395 

val Asn Gly Met Lys Arg Ser Phe Tyr Val Tyr Ala Asn Gly Gly 
2405 2410 

Arg Gly Phe Cys Lys Thr His Asn Trp Asn cys Leu Asn cys Asp 
2420 2425 

Thr Phe cys Thr Gly ser Thr Phe He ser Asp Glu val Ala Arg 
2435 2440 two 

Asp Leu ser Leu Gin Phe Lys Arg Pro lie Asn pro Thr Asp Gin 
2450 2455 

Ser ser Tyr lie val Asp ser Val Ala val Lys Asn Gly Ala Leu 
2465 2470 

His Leu Tyr Phe Asp Lys Ala Gly Gin Lys Thr Tyr Glu Arg His 
2480 2485 /4S 

pro Leu Ser His Phe val Asn Leu Asp Asn Leu Arg Ala Asn Asn 
2495 2500 250:> 

Thr Lys Gly Ser Leu Pro lie Asn val lie val Phe Asp Gly Lys 
2510 2515 zs/u 

ser Lys Cys Asp Glu Ser Ala Ser Lys Ser Ala ser Val Tyr Tyr 
2525 2530 

ser Gin Leu Met Cys Gin Pro lie Leu Leu Leu Asp Gin Ala Leu 
2540 2545 

page 97 



1er depot 



S226CAS108.ST25 

Val Ser Asp Val Gly Asp Ser Thr Glu Val ser Val Lys Met Phe 
2555 2560 2565 

Asp Ala Tyr val Asp Thr Phe Ser Ala Thr Phe Ser Val Pro Met 
2570 2575 2580 

Glu Lys Leu Lys Ala Leu Val Ala Thr Ala His Ser Glu Leu Ala 
2585 2590 2595 

Lys Gly val Ala Leu Asp Gly Val Leu Ser Thr Phe val Ser Ala 
2600 2605 2610 

Ala Arg Gin Gly Val val Asp Thr Asp val Asp Thr Lys Asp val 
2615 2620 2625 

lie Glu cys Leu Lys Leu ser His His Ser Asp Leu Glu Val Thr 
2630 2635 2640 

Gly Asp Ser Cys Asn Asn Phe Met Leu Thr Tyr Asn Lys Val Glu 
2645 2650 2655 

Asn Met Thr Pro Arg Asp Leu Gly Ala Cys lie Asp Cys Asn Ala 
2660 2665 2670 

Arg His lie Asn Ala Gin val Ala Lys Ser His Asn Val Ser Leu 
2675 2680 2685 

lie Trp Asn val Lys Asp Tyr Met ser Leu Ser Glu Gin Leu Arg 
2690 2695 2700 

Lys Gin lie Arg ser Ala Ala Lys Lys Asn Asn lie pro Phe Arg 
2705 2710 2715 

Leu Thr cys Ala Thr Thr Arg Gin val val Asn val lie Thr Thr 
2720 2725 2730 

Lys lie Ser Leu Lys Gly Gly Lys lie val ser Thr cys phe Lys 
2735 2740 2745 

Leu Met Leu Lys Ala Thr Leu Leu Cys val Leu Ala Ala Leu val 
2750 2755 2760 

Cys Tyr lie Val Met Pro val His Thr Leu Ser lie His Asp Gly 
2765 2770 2775 

Tyr Thr Asn Glu lie lie Gly Tyr Lys Ala lie Gin Asp Gly val 
2780 2785 2790 

Thr Arg Asp lie lie Ser Thr Asp Asp Cys Phe Ala Asn Lys His 
2795 2800 2805 
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Ala Gly Phe Asp Ala Trp Phe Ser Gin Arg Gly Gly Ser Tyr Lys 
2810 2815 2820 

Asn Asp Lys ser cys Pro val val Ala Ala lie lie Thr Arg Glu 
2825 2830 2835 

He Gly Phe lie Val Pro Gly Leu Pro Gly Thr Val Leu Arg Ala 
2840 2845 2850 

lie Asn Gly Asp Phe Leu His Phe Leu Pro Arg Val Phe Ser Ala 
2855 2860 2865 

val Gly Asn lie Cys Tyr Thr Pro ser Lys Leu lie Glu Tyr ser 
2870 2875 2880 

Asp Phe Ala Thr ser Ala cys val Leu Ala Ala Glu cys Thr lie 
2885 2890 2895 

Phe Lys Asp Ala Met Gly Lys Pro val Pro Tyr cys Tyr Asp Thr 
2900 2905 2910 

Asn Leu Leu Glu Gly ser He ser Tyr ser Glu Leu Arg Pro Asp 
2915 2920 2925 

Thr Arg Tyr Val Leu Met Asp Gly Ser lie lie Gin Phe Pro Asn 
2930 2935 2940 

Thr Tyr Leu Glu Gly ser Val Arg val Val Thr Thr Phe Asp Ala 
2945 2950 ^ 2955 

Glu Tyr cys Arg His Gly Thr cys Glu Arg Ser Glu Val Gly lie 
2960 2965 2970 

Cys Leu Ser Thr ser Gly Arg Trp val Leu Asn Asn Glu His Tyr 
2975 2980 2985 

Arg Ala Leu ser Gly val Phe Cys Gly Val Asp Ala Met Asn Leu 
2990 2995 3000 

lie Ala Asn lie Phe Thr Pro Leu Val Gin Pro Val Gly Ala Leu 
3005 3010 3015 

Asp val ser Ala ser Val Val Ala Gly Gly lie lie Ala lie Leu 
3020 3025 3030 

Val Thr cys Ala Ala Tyr Tyr Phe Met Lys Phe Arg Arg Val Phe 
3035 3040 3045 

Gly Glu Tyr Asn His Val val Ala Ala Asn Ala Leu Leu Phe Leu 
3050 3055 3060 

page 99 



1er depot 



S226CAS108.ST25 

Met ser Phe Thr lie Leu Cys Leu val Pro Ala Tyr Ser Phe Leu 
3065 3070 3075 

Pro Gly Val Tyr ser Val Phe Tyr Leu Tyr Leu Thr phe Tyr Phe 
3080 3085 3090 

Thr Asn Asp Val Ser Phe Leu Ala His Leu Gin Trp Phe Ala Met 
3095 3100 3105 

Phe Ser Pro lie Val Pro Phe Trp lie Thr Ala lie Tyr Val Phe 
3110 3115 3120 

cys lie Ser Leu Lys His cys His Trp Phe Phe Asn Asn Tyr Leu 
3125 3130 3135 

Arg Lys Arg Val Met Phe Asn Gly val Thr Phe ser Thr Phe Glu 
3140 3145 3150 

Glu Ala Ala Leu Cys Thr Phe Leu Leu Asn Lys Glu Met Tyr Leu 
3155 3160 3165 

Lys Leu Arg ser Glu Thr Leu Leu Pro Leu Thr Gin Tyr Asn Arg 
3170 3175 3180 

Tyr Leu Ala Leu Tyr Asn Lys Tyr Lys Tyr Phe Ser Gly Ala Leu 
3185 3190 3195 

Asp Thr Thr Ser Tyr Arg Glu Ala Ala Cys Cys His Leu Ala Lys 
3200 3205 3210 

Ala Leu Asn Asp Phe ser Asn Ser Gly Ala Asp Val Leu Tyr Gin 
3215 3220 3225 

Pro Pro Gin Thr Ser lie Thr Ser Ala Val Leu Gin Ser Gly Phe 
3230 3235 3240 

Arg Lys Met Ala Phe Pro ser Gly Lys Val Glu Gly Cys Met Val 
3245 3250 3255 

Gin Val Thr cys Gly Thr Thr Thr Leu Asn Gly Leu Trp Leu Asp 
3260 3265 3270 

Asp Thr val Tyr cys Pro Arg His val lie cys Thr Ala Glu Asp 
3275 3280 3285 

Met Leu Asn Pro Asn Tyr Glu Asp Leu Leu lie Arg Lys ser Asn 
3290 3295 3300 

His ser Phe Leu val Gin Ala Gly Asn Val Gin Leu Arg val He 
3305 3310 3315 
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Gly His ser Met Gin Asn cys Leu Leu Arg Leu Lys val Asp Thr 
3320 3325 

ser Asn Pro Lys Thr Pro Lys Tyr Lys Phe Val Arg He Gin pro 
3335 3340 3345 

Gly Gin Thr Phe ser val Leu Ala Cys Tyr Asn Gly Ser Pro ser 
3350 3355 3360 

Gly val Tyr Gin cys Ala Met Arg Pro Asn His Thr He Lys Gly 
3365 3370 3375 

ser Phe Leu Asn Gly ser cys Gly ser val Gly Phe Asn lie Asp 
3380 3385 3390 

Tyr Asp Cys val Ser Phe cys Tyr Met His His Met Glu Leu Pro 
y 3395 3400 3405 

Thr Gly val His Ala Gly Thr Asp Leu Glu Gly Lys Phe Tyr Gly 
3410 3415 3420 

pro Phe val Asp Arg Gin Thr Ala Gin Ala Ala Gly Thr Asp Thr 
3425 3430 3435 

Thr He Thr Leu Asn val Leu Ala Trp Leu Tyr Ala Ala val lie 
3440 3445 34bU 

Asn Gly Asp Arg Trp Phe Leu Asn Arg Phe Thr Thr Thr Leu Asn 
3455 " 3460 3465 

Asp Phe Asn Leu val Ala Met Lys Tyr Asn Tyr Glu Pro Leu Thr 
3470 3475 3480 

Gin Asp His val Asp He Leu Gly Pro Leu ser Ala Gin Thr Gly 
3485 3490 34y:> 

lie Ala val Leu Asp Met cys Ala Ala Leu Lys Glu Leu Leu Gin 
3500 3505 3510 

Asn Gly Met Asn Gly Arg Thr He Leu Gly ser Thr lie Leu Glu 
3515 3520 3:>" 

Asp Glu Phe Thr Pro Phe Asp val val Arg Gin Cys Ser Gly Val 
3530 3535 

Thr Phe Gin Gly Lys Phe Lys Lys He Val Lys Gly Thr His His 
i^ak 3550 355i> 



3545 

Met 
3560 



Trp Met Leu Leu Thr Phe Leu Thr ser Leu Leu lie Leu Val Gin 

3555 3 D / U 
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Ser Thr Gin Trp Ser Leu Phe Phe Phe val Tyr Glu Asn Ala Phe 
3575 3580 3585 

Leu Pro Phe Thr Leu Gly lie Met Ala lie Ala Ala Cys Ala Met 
3590 3595 3600 

Leu Leu val Lys His Lys His Ala Phe Leu Cys Leu Phe Leu Leu 
3605 3610 3615 

Pro Ser Leu Ala Thr Val Ala Tyr Phe Asn Met Val Tyr Met Pro 
3620 3625 3630 

Ala ser Trp val Met Arg lie Met Thr Trp Leu Glu Leu Ala Asp 
3635 3640 3645 

Thr ser Leu Ser Gly Tyr Arg Leu Lys Asp cys val Met Tyr Ala 
3650 3655 3660 

Ser Ala Leu Val Leu Leu lie Leu Met Thr Ala Arg Thr Val Tyr 
3665 3670 3675 

Asp Asp Ala Ala Arg Arg Val Trp Thr Leu Met Asn val lie Thr 
3680 ~ 3685 3690 

Leu Val Tyr Lys Val Tyr Tyr Gly Asn Ala Leu Asp Gin Ala lie 
3695 3700 3705 

ser Met Trp Ala Leu val lie ser val Thr ser Asn Tyr ser Gly 
3710 3715 3720 

Val Val Thr Thr lie Met Phe Leu Ala Arg Ala lie Val Phe Val 
3725 3730 3735 

Cys Val Glu Tyr Tyr Pro Leu Leu Phe lie Thr Gly Asn Thr Leu 
3740 3745 3750 

Gin Cys lie Met Leu Val Tyr Cys Phe Leu Gly Tyr cys Cys Cys 
3755 . 3760 3765 

cys Tyr Phe Gly Leu Phe cys Leu Leu Asn Arg Tyr Phe Arg Leu 
3770 3775 3780 

Thr Leu Gly val Tyr Asp Tyr Leu val Ser Thr Gin Glu Phe Arg 
3785 3790 3795 

Tyr Met Asn Ser Gin Gly Leu Leu Pro Pro Lys Ser ser lie Asp 
3800 3805 3810 

Ala Phe Lys Leu Asn lie Lys Leu Leu Gly lie Gly Gly Lys Pro 
3815 3820 3825 
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"cys lie Lys val Ala Thr val Gin Ser Lys Met Ser Asp val Lys 
3830 3835 

cys Thr ser val val Leu Leu Ser val Leu Gin Gin Leu Arg Val 
7 3845 3 850 3 »55 

Glu ser ser Ser Lys Leu Trp Ala Gin Cys Val Gin Leu His Asn 
3860 3 865 38/u 

Asp He Leu Leu Ala Lys Asp Thr Thr Glu Ala Phe Glu Lys Met 
^ 3875 3880 

val Ser Leu Leu ser Val Leu Leu Ser Met Gin Gly Ala val Asp 
3890 3895 3yuu 

lie Asn Arg Leu cys Glu Glu Met Leu Asp Asn Arg Ala Thr Leu 
3905 3 910 3915 

Gin Ala He Ala Ser Glu Phe Ser ser Leu Pro Ser Tyr Ala Ala 
3920 39 25 393 ° 

Tyr Ala Thr Ala Gin Glu Ala Tyr Glu Gin Ala val Ala Asn Gly 
3 3935 3940 39 45 

Asp ||r Q Glu Val val Leu Lys^ Lys Leu Lys Lys se^ Leu Asn val 

Ala Lys ser Glu Phe Asp Arg Asp Ala Ala Met Gin Arg Lys Leu 
3965 3970 3975 

Glu Lys Met Ala Asp Gin Ala Met Thr Gin Met Tyr Lys Gin Ala 
3980 3985 jyyu 

Arg ser Glu Asp Lys Arg Ala Lys Val Thr Ser Ala Met Gin Thr 
3995 4000 400b 

Met Leu Phe Thr Met Leu Arg Lys Leu Asp Asn Asp Ala Leu Asn 
4010 4015 4020 

Asn He He Asn Asn Ala Arg Asp Gly cys val Pro Leu Asn He 
4025 4030 4035 

lie Pro Leu Thr Thr Ala Ala Lys Leu Met val Val val Pro Asp 
4040 4045 4050 

Tyr Gly Thr Tyr Lys Asn Thr cys Asp Gly Asn Thr Phe Thr Tyr 
4055 4060 40bb 

Ala Ser Ala Leu Trp Glu lie Gin Gin Val val Asp Ala Asp Ser 
4070 4075 4080 
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Lys lie val Gin Leu Ser Glu lie Asn Met Asp Asn Ser Pro Asn 
4085 4090 4095 

Leu Ala Trp Pro Leu lie Val Thr Ala Leu Arg Ala Asn Ser Ala 
4100 4105 4110 

Val Lys Leu Gin Asn Asn Glu Leu ser Pro Val Ala Leu Arg Gin 
4115 4120 4125 

Met ser Cys Ala Ala Gly Thr Thr Gin Thr Ala Cys Thr Asp Asp 
4130 4135 4140 

Asn Ala Leu Ala Tyr Tyr Asn Asn Ser Lys Gly Gly Arg Phe val 
4145 4150 4155 

Leu Ala Leu Leu ser Asp His Gin Asp Leu Lys Trp Ala Arg Phe 
4160 4165 4170 

Pro Lys Ser Asp Gly Thr Gly Thr lie Tyr Thr Glu Leu Glu Pro 
4175 4180 4185 

Pro cys Arg Phe Val Thr Asp Thr Pro Lys Gly Pro Lys Val Lys 
4190 " 4195 4200 

Tyr Leu Tyr Phe lie Lys Gly Leu Asn Asn Leu Asn Arg Gly Met 
4205 4210 4215 

val Leu Gly ser Leu Ala Ala Thr val Arg Leu Gin Ala Gly Asn 
4220 4225 4230 

Ala Thr Glu val Pro Ala Asn Ser Thr Val Leu Ser Phe cys Ala 
4235 4240 4245 

Phe Ala val Asp Pro Ala Lys Ala Tyr Lys Asp Tyr Leu Ala Ser 
4250 4255 4260 

Gly Gly Gin Pro lie Thr Asn Cys Val Lys Met Leu Cys Thr His 
4265 4270 4275 

Thr Gly Thr Gly Gin Ala lie Thr Val Thr Pro Glu Ala Asn Met 
4280 4285 4290 

Asp Gin Glu Ser Phe Gly Gly Ala ser Cys Cys Leu Tyr Cys Arg 
4295 4300 ' 4305 

Cys His lie Asp His Pro Asn Pro Lys Gly Phe cys Asp Leu Lys 
4310 4315 4320 . 

Gly Lys Tyr val Gin lie Pro Thr Thr Cys Ala Asn Asp Pro Val 
4325 4330 4335 
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Gly Phe Thr Leu Arg Asn Thr Val Cys Thr val Cys Gly Met Trp 
4340 ~ 4345 4350 

Lys Gly Tyr Gly Cys Ser cys Asp Gin Leu Arg Glu Pro Leu Met 
4355 4360 4365 

Gin ser Ala Asp Ala ser Thr Phe Leu Asn Gly Phe Ala Val 
4370 4375 4380 

<210> 75 

<211> 2695 

<212> PRT 

<213> CORONAVIRUS 



<400> 75 

Arg val cys Gly val ser Ala Ala Arg Leu Thr Pro cys Gly Thr Gly 
15 10 15 

Thr Ser Thr Asp val val Tyr Arg Ala Phe Asp lie Tyr Asn Glu Lys 
20 25 30 

Val Ala Gly Phe Ala Lys Phe Leu Lys Thr Asn cys cys Arg Phe Gin 
35 40 45 

Glu Lys Asp Glu Glu Gly Asn Leu Leu Asp Ser Tyr phe Val Val Lys 
50 55 60 

Arg His Thr Met ser Asn Tyr Gin His Glu Glu Thr lie Tyr Asn Leu 
65 70 75 80 

val Lys Asp cys Pro Ala val Ala Val His Asp Phe Phe Lys Phe Arg 
85 90 95 

val Asp Gly Asp Met Val Pro His lie Ser Arg Gin Arg Leu Thr Lys 
100 105 110 

Tyr Thr Met Ala Asp Leu Val Tyr Ala Leu Arg His Phe Asp Glu Gly 
115 120 ~ 125 

Asn Cys Asp Thr Leu Lys Glu lie Leu val Thr Tyr Asn Cys Cys Asp 
130 135 140 

Asp Asp Tyr Phe Asn Lys Lys Asp Trp Tyr Asp Phe Val Glu Asn Pro 
145 150 155 160 

Asp lie Leu Arg Val Tyr Ala Asn Leu Gly Glu Arg Val Arg Gin Ser 
165 170 175 
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Leu Leu Lys Thr Val Gin Phe Cys Asp Ala Met Arg Asp Ala Gly lie 
180 185 190 

Val Gly Val Leu Thr Leu Asp Asn Gin Asp Leu Asn Gly Asn Trp Tyr 
195 200 205 

Asp Phe Gly Asp Phe val Gin val Ala Pro Gly cys Gly val Pro lie 
210 215 220 

val Asp Ser Tyr Tyr ser Leu Leu Met Pro lie Leu Thr Leu Thr Arg 
225 230 235 240 

Ala Leu Ala Ala Glu ser His Met Asp Ala Asp Leu Ala Lys Pro Leu 
245 250 255 

lie Lys Trp Asp Leu Leu Lys Tyr Asp Phe Thr Glu Glu Arg Leu Cys 
260 265 270 

Leu Phe Asp Arg Tyr Phe Lys Tyr Trp Asp Gin Thr Tyr His pro Asn 
275 280 285 

Cys lie Asn cys Leu Asp Asp Arg cys lie Leu His cys Ala Asn Phe 
290 295 300 

Asn Val Leu Phe Ser Thr Val Phe Pro Pro Thr Ser Phe Gly Pro Leu 
305 310 315 320 

Val Arg Lys lie Phe val Asp Gly val Pro Phe val val Ser Thr Gly 
325 330 335 

Tyr His Phe Arg Glu Leu Gly val val His Asn Gin Asp Val Asn Leu 
340 345 350 

His Ser ser Arg Leu Ser Phe Lys Glu Leu Leu val Tyr Ala Ala Asp 
355 360 365 

Pro Ala Met His Ala Ala Ser Gly Asn Leu Leu Leu Asp Lys Arg Thr 
370 375 380 

Thr Cys Phe ser Val Ala Ala Leu Thr Asn Asn Val Ala Phe Gin Thr 
385 390 395 400 

Val Lys Pro Gly Asn Phe Asn Lys Asp Phe Tyr Asp Phe Ala val Ser 
405 410 415 

Lys Gly Phe Phe Lys Glu Gly Ser Ser Val Glu Leu Lys His Phe Phe 
420 425 430 

Phe Ala Gin Asp Gly Asn Ala Ala lie Ser Asp Tyr Asp Tyr Tyr Arg 
435 440 445 
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Tyr Asn Leu Pro Thr Met Cys Asp He Arg Gin Leu Leu Phe Val Val 
450 ^55 HX}KJ 

Glu val val Asp Lys Tyr Phe Asp Cys Tyr Asp Gly Gly cys lie Asn 
465 470 

Ala Asn Gin val He Val Asn Asn Leu Asp Lys ser Ala Gly Phe Pro 
485 4yu 

Phe Asn Lys Trp Gly Lys Ala Arg Leu Tyr Tyr Asp Ser Met Ser Tyr 
500 505 

Glu Asp Gin Asp Ala Leu Phe Ala Tyr Thr Lys Arg Asn Val He Pro 
515 520 3 " 

Thr He Thr Gin Met Asn Leu Lys Tyr Ala lie ser Ala Lys Asn Arg 
530 535 3W 

Ala Arg Thr val Ala Gly val ser He cys Ser Thr Met Thr Asn Arg 
545 550 

Gin Phe His Gin Lys Leu Leu Lys ser lie Ala Ala Thr Arg Gl^ Ala 
565 d/u 

Thr val val lie Gly Thr ser Lys Phe Tyr Gly Gly Trp His Asn Met 
580 585 

Leu Lys Thr val Tyr ser Asp Val Glu Thr Pro His Leu Met Gly Trp 
5g5 600 

Asp Tyr Pro Lys cys Asp Arg Ala Met Pro Asn Met Leu Arg He Met 
610 615 

Ala ser Leu Val Leu Ala Arg Lys His Asn Thr cys cys Asn Leu Ser 
625 630 635 

His Arg Phe Tyr Arg Leu Ala Asn Glu cys Ala Gin Val Leu ser Glu 

Met Val Met cys Gly Gly Ser Leu Tyr Val Lys Pro Gly Gly Thr ser 
660 665 o/u 

ser Gly Asp Ala Thr Thr Ala Tyr Ala Asn ser val Phe Asn He cys 
675 680 oo:> 

Gin Ala val Thr Ala Asn Val Asn Ala Leu Leu ser Thr Asp Gly Asn 
690 695 700 

Lys He Ala Asp Lys Tyr val Arg Asn Leu Gin His Arg Leu Tyr Glu 
705 710 
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Cys Leu Tyr Arg Asn Arg Asp val Asp His Glu phe val Asp Glu Phe 
725 730 735 

Tyr Ala Tyr Leu Arg Lys His Phe ser Met Met He Leu Ser Asp Asp 
740 745 750 

Ala Val Val cys Tyr Asn Ser Asn Tyr Ala Ala Gin Gly Leu Val Ala 
755 760 765 

ser lie Lys Asn Phe Lys Ala val Leu Tyr Tyr Gin Asn Asn Val Phe 
770 775 780 

Met Ser Glu Ala Lys Cys Trp Thr Glu Thr Asp Leu Thr Lys Gly Pro 
785 790 795 800 

His Glu Phe cys Ser Gin His Thr Met Leu Val Lys Gin Gly Asp Asp 
805 810 815 

Tyr val Tyr Leu Pro Tyr Pro Asp pro Ser Arg lie Leu Gly Ala Gly 
820 825 830 

cys Phe Val Asp Asp lie Val Lys Thr Asp Gly Thr Leu Met lie Glu 
835 840 845 

Arg Phe Val Ser Leu Ala lie Asp Ala Tyr Pro Leu Thr Lys His Pro 
850 855 860 

Asn Gin Glu Tyr Ala Asp val Phe His Leu Tyr Leu Gin Tyr lie Ar 
865 870 875 88 

Lys Leu His Asp Glu Leu Thr Gly His Met Leu Asp Met Tyr ser Val 
885 890 895 

Met Leu Thr Asn Asp Asn Thr Ser Arg Tyr Trp Glu Pro Glu phe Tvr 
900 905 910 

Glu Ala Met Tyr Thr Pro His Thr Val Leu Gin Ala val Gly Ala cys 
915 920 925 

Val Cys Asn Ser Gln Thr Ser Leu Arg cys Gly Ala Cys lie Arq 
930 935 940 

Arg pro Phe Leu Cys Cys Lys cys Cys Tyr Asp His Val lie Ser Thr 
945 950 955 960 

Ser His Lys Leu Val Leu ser Val Asn Pro Tyr Val Cys Asn Ala Pro 
965 970 975 

Gly Cys Asp val Thr Asp Val Thr Gin Leu Tyr Leu Gly Gly Met Ser 
980 985 990 
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Tyr Tyr g| Lys ser His Lys Pro Q Pro He ser Phe Pro^ Leu Cys Ala 

Asn Gly Gin Val Phe Gly Leu Tyr Lys Asn Thr cys val Gly Ser 
1010 1015 iV 

Asp Asn Val Thr Asp Phe Asn Ala He Ala Thr Cys Asp Trp Thr 
1025 1030 XU5 

Asn Ala Gly Asp Tyr He Leu Ala Asn Thr Cys Thr Glu Arg Leu 
1040 1045 10;,U 

Lys Leu Phe Ala Ala Glu Thr Leu Lys Ala Thr Glu Glu Thr Phe 
y 1055 1060 1065 

Lys Leu ser Tyr Gly He Ala Thr Val Arg Glu val Leu ser Asp 
1070 1° 75 

Arg Glu Leu His Leu Ser Trp Glu val Gly Lys Pro Arg Pro Pro 
3 1085 1090 1° 9: > 

Leu Asn Arg Asn Tyr Val Phe Thr Gly Tyr Arg Val Thr Lys Asn 
1100 1105 - LJ " LU 

ser Lys val Gin He Gly Glu Tyr Thr Phe Glu Lys Gly Asp Tyr 
1115 1120 

Gly Asp Ala val val Tyr Arg Gly Thr Thr Thr Tyr Lys Leu Asn 
1130 1135 l 140 

val Gly Asp Tyr Phe Val Leu Thr ser His Thr val Met Pro Leu 
1145 1150 xs.30 

ser Ala Pro Thr Leu Val Pro Gin Glu His Tyr Val Arg He Thr 
1160 H 65 1170 

Gly Leu Tyr Pro Thr Leu Asn He ser Asp Glu Phe Ser ser Asn 
1175 1180 118 3 

val Ala Asn Tyr Gin Lys Val Gly Met Gin Lys Tyr Ser Thr Leu 
H90 1195 1^01) 

Gin Gly Pro Pro Gly Thr Gly Lys ser His Phe Ala He Gly Leu 
1205 121° 1<J1:> 

Ala Leu Tyr Tyr Pro Ser Ala Arg He Val Tyr Thr Ala cys Ser 
1220 1225 ItSV 

His Ala Ala Val Asp Ala Leu Cys Glu Lys Ala Leu Lys Tyr Leu 
1235 1240 1 24 5 
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Pro He Asp Lys Cys Ser Arg He He Pro Ala Arg Ala Arg val 
1250 1255 1260 

Glu cys Phe Asp Lys Phe Lys val Asn ser Thr Leu Glu Gin Tyr 
1265 1270 1275 

Val Phe cys Thr val Asn Ala Leu Pro Glu Thr Thr Ala Asp lie 
1280 1285 1290 

val val Phe Asp Glu lie ser Met Ala Thr Asn Tyr Asp Leu Ser 
1295 1300 1305 

Val val Asn Ala Arg Leu Arg Ala Lys His Tyr val Tyr lie Gly 
1310 1315 1320 

Asp Pro Ala Gin Leu Pro Ala Pro Arg Thr Leu Leu Thr Lys Gly 
1325 1330 1335 

Thr Leu Glu Pro Glu Tyr Phe Asn Ser val Cys Arg Leu Met Lys 
1340 1345 1350 

Thr lie Gly Pro Asp Met Phe Leu Gly Thr Cys Arg Arg cys Pro 
1355 1360 1365 

Ala Glu He Val Asp Thr val Ser Ala Leu val Tyr Asp Asn Lys 
1370 1375 1380 

Leu Lys Ala His Lys Asp Lys Ser Ala Gin cys Phe Lys Met Phe 
1385 1390 1395 

Tyr Lys Gly Val lie Thr His Asp Val ser Ser Ala lie Asn Arg 
1400 1405 1410 

Pro Gin lie Gly Val Val Arg Glu Phe Leu Thr Arg Asn Pro Ala 
1415 1420 1425 

Trp Arg Lys Ala Val Phe lie Ser Pro Tyr Asn Ser Gin Asn Ala 
1430 1435 ' 1440 

Val Ala ser Lys lie Leu Gly Leu Pro Thr Gin Thr Val Asp Ser 
1445 1450 1455 

ser Gin Gly ser Glu Tyr Asp Tyr val lie Phe Thr Gin Thr Thr 
1460 1465 1470 

Glu Thr Ala His Ser cys Asn val Asn Arg Phe Asn Val Ala lie 
1475 1480 1485 

Thr Arg Ala Lys lie Gly lie Leu Cys lie Met Ser Asp Arg Asp 
1490 1495 1500 
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Leu Tyr Asp Lys Leu Gin Phe Thr ser Leu Glu lie Pro Arg Arg 
1505 1510 1515 

Asn val Ala Thr Leu Gin Ala Glu Asn val Thr Gly Leu Phe Lys 
1520 1525 1530 

Asp Cys Ser Lys lie lie Thr Gly Leu His Pro Thr Gin Ala Pro 
1535 1540 1545 

Thr His Leu ser val Asp lie Lys Phe Lys Thr Glu Gly Leu Cys 
1550 1555 1560 

Val Asp lie Pro Gly lie Pro Lys Asp Met Thr Tyr Arg Arg Leu 
1565 1570 1575 

lie ser Met Met Gly Phe Lys Met Asn Tyr Gin Val Asn Gly Tyr 
1580 1585 1590 

Pro Asn Met Phe lie Thr Arg Glu Glu Ala lie Arg His val Arg 
1595 1600 1605 

Ala Trp lie Gly Phe Asp val Glu Gly cys His Ala Thr Arg Asp 
1610 1615 1620 

Ala val Gly Thr Asn Leu Pro Leu Gin Leu Gly Phe ser Thr Gly 
1625 1630 1635 

Val Asn Leu Val Ala Val Pro Thr Gly Tyr val Asp Thr Glu Asn 
1640 1645 1650 

Asn Thr Glu Phe Thr Arg Val Asn Ala Lys Pro Pro Pro Gly Asp 
1655 1660 1665 

Gin Phe Lys His Leu lie Pro Leu Met Tyr Lys Gly Leu Pro Trp 
1670 1675 1680 

Asn val Val Arg lie Lys lie Val Gin Met Leu Ser Asp Thr Leu 
1685 1690 1695 

Lys Gly Leu Ser Asp Arg Val Val Phe Val Leu Trp Ala His Gly 
1700 1705 1710 

Phe Glu Leu Thr ser Met Lys Tyr Phe val Lys lie Gly Pro Glu 
1715 1720 1725 

Arg Thr Cys cys Leu Cys Asp Lys Arg Ala Thr cys Phe ser Thr 
1730 1735 1740 

Ser ser Asp Thr Tyr Ala Cys Trp Asn His ser Val Gly Phe Asp 
1745 1750 1755 
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Tyr Val Tyr Asn Pro Phe Met lie Asp Val Gin Gin Trp Gly Phe 
1760 1765 1770 

Thr Gly Asn Leu Gin Ser Asn His Asp Gin His cys Gin Val His 
1775 1780 1785 

Gly Asn Ala His val Ala Ser cys Asp Ala lie Met Thr Arg Cys 
1790 1795 1800 

Leu Ala val His Glu Cys Phe Val Lys Arg Val Asp Trp ser Val 
1805 1810 1815 

Glu Tyr Pro lie lie Gly Asp Glu Leu Arg Val Asn Ser Ala Cys 
1820 1825 1830 

Arg Lys Val Gin His Met Val Val Lys Ser Ala Leu Leu Ala Asp 
1835 1840 1845 

Lys Phe Pro val Leu His Asp He Gly Asn Pro Lys Ala lie Lys 
1850 1855 1860 

Cys val Pro Gin Ala Glu val Glu Trp Lys Phe Tyr Asp Ala Gin 
1865 1870 1875 

Pro Cys ser Asp Lys Ala Tyr Lys lie Glu Glu Leu Phe Tyr ser 
1880 1885 1890 

Tyr Ala Thr His His Asp Lys Phe Thr Asp Gly Val Cys Leu Phe 
1895 1900 1905 

Trp Asn Cys Asn val Asp Arg Tyr pro Ala Asn Ala lie Val Cys 
1910 1915 1920 

Arg Phe Asp Thr Arg val Leu Ser Asn Leu Asn Leu Pro Gly cys 
1925 1930 1935 

Asp Gly Gly ser Leu Tyr Val Asn Lys His Ala Phe His Thr pro 
1940 1945 1950 

Ala Phe Asp Lys Ser Ala Phe Thr Asn Leu Lys Gin Leu Pro Phe 
1955 1960 1965 

Phe Tyr Tyr Ser Asp Ser Pro Cys Glu ser His Gly Lys Gin Val 
1970 1975 1980 

Val ser Asp lie Asp Tyr Val pro Leu Lys ser Ala Thr cys lie 
1985 1990 1995 

Thr Arg cys Asn Leu Gly Gly Ala Val Cys Arg His His Ala Asn 
2000 2005 2010 
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Glu Tyr Arg Gin Tyr Leu Asp Ala Tyr Asn Met Met lie ser Ala 
2015 " 2020 2025 

Gly Phe ser Leu Trp lie Tyr Lys Gin Phe Asp Thr Tyr Asn Leu 
2030 2035 2040 

Trp Asn Thr Phe Thr Arg Leu Gin Ser Leu Glu Asn val Ala Tyr 
2045 2050 2055 

Asn Val Val Asn Lys Gly His Phe Asp Gly His Ala Gly Glu Ala 
2060 2065 2070 

Pro val Ser lie lie Asn Asn Ala val Tyr Thr Lys Val Asp Gly 
2075 2080 2085 

lie Asp Val Glu lie Phe Glu Asn Lys Thr Thr Leu Pro Val Asn 
2090 2095 2100 

Val Ala Phe Glu Leu Trp Ala Lys Arg Asn lie Lys Pro Val Pro 
2105 2110 2115 

Glu lie Lys lie Leu Asn Asn Leu Gly val Asp lie Ala Ala Asn 
2120 2125 2130 

Thr val lie Trp Asp Tyr Lys Arg Glu Ala Pro Ala His val ser 
2135 2140 2145 

Thr lie Gly Val Cys Thr Met Thr Asp lie Ala Lys Lys Pro Thr 
2150 2155 2160 

Glu Ser Ala Cys ser Ser Leu Thr Val Leu Phe Asp Gly Arg val 
2165 2170 2175 

Glu Gly Gin Val Asp Leu Phe Arg Asn Ala Arg Asn Gly Val Leu 
2180 2185 2190 

lie Thr Glu Gly Ser val Lys Gly Leu Thr Pro Ser Lys Gly Pro 
2195 2200 2205 

Ala Gin Ala Ser Val Asn Gly Val Thr Leu lie Gly Glu Ser val 
2210 2215 2220 

Lys Thr Gin Phe Asn Tyr Phe Lys Lys val Asp Gly lie lie Gin 
2225 2230 2235 

Gin Leu Pro Glu Thr Tyr Phe Thr Gin Ser Arg Asp Leu Glu Asp 
2240 2245 2250 

Phe Lys Pro Arg Ser Gin Met Glu Thr Asp Phe Leu Glu Leu Ala 
2255 2260 2265 
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Met Asp Glu Phe He Gin Arg Tyr i_ys Leu Glu Gly Tyr Ala Phe 
2270 2275 2280 

Glu ^fr I1e Va1 Tyr Gl y As P Phe ser His Gly Gin Leu Gly Gly 
2285 2290 2295 

Leu Leu Met Ile Gly Leu Ala L ys Arg ser Gin Asp Ser Pro 

2300 2305 " 2310 

Leu Leu Glu AS P Pne 11 e Pro Met Asp Ser Thr val Lys Asn 

2315 2320 2325 

TyP 2330 11 6 ASP 2335 SeP SCr 2340 ^ 

Ser Val lie Asp Leu Leu Leu Asp Asp phe val Glu He He Lys 
2345 2350 2355 

S6r Asp Leu Ser Val il? ser L y s Val val L ys val Thr ile 

2360 2365 2370 

AS P Tyr Ala Glu lie Ser Phe Met Leu Trp cys Lys Asp Gly His 
23/5 2380 2385 

Va1 ol^n Thr Phe 7yr Pro L y s Leu Gin Ala Ser Gin Ala Trp Gin 
* 4yo 2395 2400 

Pr ° o]Xc Va1 Ala Met Pro Asn Leu "Tyr Lys Met Gin Arg Met Leu 
2405 2410 2415 

LeU o]™ Lys Cys Asp Leu Gin Asn Tyr Gly Glu Asn Ala val He 
2420 2425 2430 

Pr ° klU Gly 11 e Met Met Asn va1 Ala L y s Tyr Thr Gin Leu cys 
£435 2440 2445 

Gln Vt™ LeU Asn Thr Leu X^r Leu Ala val Pro Tyr Asn Met Arg 
Z4:>0 2455 2460 

Val ?]fc His Phe Gly Ala Gl y ser AS P L y s Gly Val Ala Pro Gly 
2465 2470 2475 

Thr A ]f rt Val Leu Arg Gln Tr P Leu Pro Th r Gly Thr Leu Leu val 
2480 2485 2490 

Asp f^nc Asp Leu Asn AS P Phe val Ser AS P Ala Asp ser Thr Leu 
2495 2500 2505 

11 6 2510 ASP ^ 2515 H1S AU AS " 2520 ^ ASP LSU 
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lie He ser Asp Met Tyr Asp Pro Arg Thr Lys His Val Thr Lys 
2525 2530 

Glu Asn Asp ser Lys Glu Gly Phe Phe Thr Tyr Leu cys Gly Phe 
2540 2545 

He Lys Gin Lys Leu Ala Leu Gly Gly ser He Ala val Lys He 
2555 2560 

Thr Glu His ser Trp Asn Ala Asp Leu Tyr Lys Leu Met Gly His 
2570 2575 

Phe ser Trp Trp Thr Ala Phe val Thr Asn Val Asn Ala ser ser 
2585 2590 

ser Glu Ala Phe Leu He Gly Ala Asn Tyr Leu Gl£ Lys Pro Lys 
2600 2605 

Glu Gin He Asp Gly Tyr Thr Met His Ala Asn Tyr He Phe Trp 
2615 2620 

Arg Asn Thr Asn Pro He Gin Leu ser ser Tyr ser Leu Phe Asp 
2630 2635 

Met ser Lys Phe Pro Leu Lys Leu Arg Gly Thr Ala Val Met Ser 
2645 2650 

Leu Lys Glu Asn Gin He Asn Asp Met He Tyr Ser Leu Leu Glu 
2660 2665 

Lys Gly s Arg Leu He He Arg Q Glu Asn Asn Arg Val.. Val val ser 

Ser Asp He Leu val Asn Asn 
2690 2695 
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